• Nosotros
  • Publicidad
  • Políticas de Privacidad
  • Contacto
Nexxo News
  • Home
  • Tendencias
  • Tecnología
    • All
    • Mundo Android
    • Mundo APPLE
    • Mundo Xiaomi

    Hemos descubierto el ‘botón’ que usan las bacterias para escapar de los virus: es la clave para acabar con las superbacterias

    Apple se ha convertido en una empresa aburrida. Nos preguntamos quién heredará su trono: Crossover 1×24

    Estados Unidos tiene un plan B para ganarle la carrera lunar a China: cambiar la nave de Elon Musk por la de Jeff Bezos

    El secreto para comprar en Amazon prime Day desde Argentina y ahorrar al máximo

    Sobre el futuro de las motos eléctricas de gran cilindrada, BMW tiene respuesta: «no vemos una demanda real»

    El presente inmediato de Apple y su futuro (no tan lejano) es apasionante

    • Mundo Android
    • Mundo APPLE
  • Inteligencia Artificial
  • Negocios
    • All
    • Agronegocios
    • Vinos

    Silicon NOA: programa WISE inyecta capital humano femenino en la economía del conocimiento regional

    Un viaje más inteligente y sostenible: Rentennials implanta el carsharing como alternativa viable para recorrer salinas y la Quebrada

    Alianza estratégica en el NOA: Tucumán y Salta unirán fuerzas para potenciar la Economía del Conocimiento

    Orgullo tucumano: Tafí del Valle recibe el Premio FED como destino destacado de Argentina y se proyecta a la FIT 2025

    El sector audiovisual despega: Tucumán inaugura «Visión Norte», el primer mercado del NOA con sello emprendedor

    Arrancó UNSTA Emprende, la gira de innovación y pone a Tucumán en el mapa de congresos nacionales

    • Agronegocios
    • Vinos
  • Marketing

    Silicon NOA: programa WISE inyecta capital humano femenino en la economía del conocimiento regional

    Un viaje más inteligente y sostenible: Rentennials implanta el carsharing como alternativa viable para recorrer salinas y la Quebrada

    Orgullo tucumano: Tafí del Valle recibe el Premio FED como destino destacado de Argentina y se proyecta a la FIT 2025

    Emprendimiento tucumano impulsa la producción regional: Famaillá lanza cerveza de arándano sin gluten

    La IA de Google te permite crear fotos estilo Polaroid con cualquier famoso, de forma gratuita

    Tucumán apuesta por la conectividad: Inversión de US$ 50 millones para la modernización del Aeropuerto Benjamín Matienzo

  • Noticias

    Alianza estratégica en el NOA: Tucumán y Salta unirán fuerzas para potenciar la Economía del Conocimiento

    El sector audiovisual despega: Tucumán inaugura «Visión Norte», el primer mercado del NOA con sello emprendedor

    Arrancó UNSTA Emprende, la gira de innovación y pone a Tucumán en el mapa de congresos nacionales

    El gobierno tucumano lanza un programa provincial para convertir a Tucumán en el polo cafetero argentino

    Avance clave en Argentina: Tucumán sanciona ley de incentivos fiscales para vehículos eléctricos e híbridos

    Ford Experience llega al NOA: Tucumán será la primera parada de un evento sin precedentes en la provincia

  • Gamer

    Hemos descubierto el ‘botón’ que usan las bacterias para escapar de los virus: es la clave para acabar con las superbacterias

    Apple se ha convertido en una empresa aburrida. Nos preguntamos quién heredará su trono: Crossover 1×24

    Estados Unidos tiene un plan B para ganarle la carrera lunar a China: cambiar la nave de Elon Musk por la de Jeff Bezos

    Sobre el futuro de las motos eléctricas de gran cilindrada, BMW tiene respuesta: «no vemos una demanda real»

    Shein no tiene ninguna tienda física (oficial) permanente en Europa. Esto está a punto de cambiar con su último movimiento

    La Unión Europea impondrá un nuevo impuesto al CO2 en 2027. Y eso significa una cosa: gasolina más cara

    • Guias de Videojuegos
  • Aplicaciones

    Tucumán lanza Bonus Ticket, una plataforma que digitaliza y potencia a emprendedores y epymes del sector turístico

    Tucumán, el eje clave de DiDi en Argentina: US$160 Millones para impulsar su crecimiento y la economía local

    La carrera que soñabas podría estar desapareciendo: cómo la IA transforma el mercado laboral y qué significa para los jóvenes

    Onepass llega a Tucumán y revoluciona la manera de viajar en transporte público

    Basta de errores al escribir. Ahora la IA te ayudará a escribir tus mensajes de WhatsApp

    El fin de Whatsapp gratuito. Meta lanza anuncios dentro de la sección de Novedades

No Result
View All Result
  • Home
  • Tendencias
  • Tecnología
    • All
    • Mundo Android
    • Mundo APPLE
    • Mundo Xiaomi

    Hemos descubierto el ‘botón’ que usan las bacterias para escapar de los virus: es la clave para acabar con las superbacterias

    Apple se ha convertido en una empresa aburrida. Nos preguntamos quién heredará su trono: Crossover 1×24

    Estados Unidos tiene un plan B para ganarle la carrera lunar a China: cambiar la nave de Elon Musk por la de Jeff Bezos

    El secreto para comprar en Amazon prime Day desde Argentina y ahorrar al máximo

    Sobre el futuro de las motos eléctricas de gran cilindrada, BMW tiene respuesta: «no vemos una demanda real»

    El presente inmediato de Apple y su futuro (no tan lejano) es apasionante

    • Mundo Android
    • Mundo APPLE
  • Inteligencia Artificial
  • Negocios
    • All
    • Agronegocios
    • Vinos

    Silicon NOA: programa WISE inyecta capital humano femenino en la economía del conocimiento regional

    Un viaje más inteligente y sostenible: Rentennials implanta el carsharing como alternativa viable para recorrer salinas y la Quebrada

    Alianza estratégica en el NOA: Tucumán y Salta unirán fuerzas para potenciar la Economía del Conocimiento

    Orgullo tucumano: Tafí del Valle recibe el Premio FED como destino destacado de Argentina y se proyecta a la FIT 2025

    El sector audiovisual despega: Tucumán inaugura «Visión Norte», el primer mercado del NOA con sello emprendedor

    Arrancó UNSTA Emprende, la gira de innovación y pone a Tucumán en el mapa de congresos nacionales

    • Agronegocios
    • Vinos
  • Marketing

    Silicon NOA: programa WISE inyecta capital humano femenino en la economía del conocimiento regional

    Un viaje más inteligente y sostenible: Rentennials implanta el carsharing como alternativa viable para recorrer salinas y la Quebrada

    Orgullo tucumano: Tafí del Valle recibe el Premio FED como destino destacado de Argentina y se proyecta a la FIT 2025

    Emprendimiento tucumano impulsa la producción regional: Famaillá lanza cerveza de arándano sin gluten

    La IA de Google te permite crear fotos estilo Polaroid con cualquier famoso, de forma gratuita

    Tucumán apuesta por la conectividad: Inversión de US$ 50 millones para la modernización del Aeropuerto Benjamín Matienzo

  • Noticias

    Alianza estratégica en el NOA: Tucumán y Salta unirán fuerzas para potenciar la Economía del Conocimiento

    El sector audiovisual despega: Tucumán inaugura «Visión Norte», el primer mercado del NOA con sello emprendedor

    Arrancó UNSTA Emprende, la gira de innovación y pone a Tucumán en el mapa de congresos nacionales

    El gobierno tucumano lanza un programa provincial para convertir a Tucumán en el polo cafetero argentino

    Avance clave en Argentina: Tucumán sanciona ley de incentivos fiscales para vehículos eléctricos e híbridos

    Ford Experience llega al NOA: Tucumán será la primera parada de un evento sin precedentes en la provincia

  • Gamer

    Hemos descubierto el ‘botón’ que usan las bacterias para escapar de los virus: es la clave para acabar con las superbacterias

    Apple se ha convertido en una empresa aburrida. Nos preguntamos quién heredará su trono: Crossover 1×24

    Estados Unidos tiene un plan B para ganarle la carrera lunar a China: cambiar la nave de Elon Musk por la de Jeff Bezos

    Sobre el futuro de las motos eléctricas de gran cilindrada, BMW tiene respuesta: «no vemos una demanda real»

    Shein no tiene ninguna tienda física (oficial) permanente en Europa. Esto está a punto de cambiar con su último movimiento

    La Unión Europea impondrá un nuevo impuesto al CO2 en 2027. Y eso significa una cosa: gasolina más cara

    • Guias de Videojuegos
  • Aplicaciones

    Tucumán lanza Bonus Ticket, una plataforma que digitaliza y potencia a emprendedores y epymes del sector turístico

    Tucumán, el eje clave de DiDi en Argentina: US$160 Millones para impulsar su crecimiento y la economía local

    La carrera que soñabas podría estar desapareciendo: cómo la IA transforma el mercado laboral y qué significa para los jóvenes

    Onepass llega a Tucumán y revoluciona la manera de viajar en transporte público

    Basta de errores al escribir. Ahora la IA te ayudará a escribir tus mensajes de WhatsApp

    El fin de Whatsapp gratuito. Meta lanza anuncios dentro de la sección de Novedades

No Result
View All Result
Nexxo News
No Result
View All Result
Home Tecnología

Sin libros escaneados (y descargados con torrent) no tendríamos IAs: una batalla legal está sacando a la luz cómo se han entrenado

Pablo E. Páez by Pablo E. Páez
26 junio, 2025
in Tecnología
0 0
0
0
SHARES
0
VIEWS
Share on FacebookShare on Twitter

Sin libros escaneados (y descargados con torrent) no tendríamos IAs: una batalla legal está sacando a la luz cómo se han entrenado

Los modelos de IA capaces de generar textos tienen cada vez más presencia en nuestro día a día. Y eso hace que mucha gente se plantee una pregunta crucial: ¿dónde aprendieron estas máquinas a escribir como lo hacen? La respuesta es que lo han logrado ‘leyendo’ millones de libros durante su entrenamiento, en numerosos casos, sin autorización de sus autores.

Y no sólo eso: en casos como el de LLaMa, la IA de Meta, su entrenamiento tuvo lugar después de que la compañía recurrió sin miramientos a descargas masivas de libros desde bibliotecas online no autorizadas por los titulares de los derechos, como LibGen.

Recientes evidencias judiciales indican que la compañía de Zuckerberg habría insistido en recurrir a estas fuentes incluso después de que ingenieros expresaran dudas al respecto a nivel interno:

«No parece correcto estar descargando torrents desde un equipo corporativo».

Y ahora, tanto el uso de libros como el debatido origen de los mismos ha iniciado un interesante debate legal, y desembocado recientemente en diversas demandas aún por resolver ante los tribunales.

El caso Anthropic: ¿lectura o robo?

La reciente resolución del juez federal William Alsup en el caso contra Anthropic, la empresa detrás del modelo de lenguaje Claude, ha sido calificada de histórica: en su fallo de hace dos días, Alsup determinó que entrenar una inteligencia artificial con libros protegidos por derechos de autor puede constituir ‘uso justo’ (fair use) bajo la legislación estadounidense.

De hecho, el juez fue más allá y comparó el aprendizaje de los LLM (modelos de lenguaje de gran escala) con el proceso de un lector humano que estudia autores para desarrollar su propio estilo. En sus palabras, el uso de los libros por parte de la IA era «espectacularmente transformador», ya que no se trataba de copiar, sino de crear algo distinto.

Sin embargo, eso no significa que Alsup diera carta blanca a la industria: en el mismo fallo, condenó a Anthropic por haber acumulado más de 7 millones de libros descargados de fuentes no autorizadas para formar una biblioteca digital central, una práctica que calificó como una infracción directa del copyright. Aunque la empresa luego compró muchos de esos libros, eso no la exime de responsabilidad: se celebrará un juicio en diciembre para determinar los daños económicos.


ChatGPT no está borrando el registro de ninguno de tus chats. Es por orden de una juez, pero no está claro que sea legal
En Genbeta

ChatGPT no está borrando el registro de ninguno de tus chats. Es por orden de una juez, pero no está claro que sea legal

Microsoft en el punto de mira

La decisión judicial sobre Anthropic contrasta con la situación que enfrenta Microsoft, ahora demandada por un grupo de reconocidos escritores estadounidenses, que alegan que la empresa utilizó versiones escaneadas extraoficialmente de casi 200.000 libros para entrenar su modelo ‘Megatron’ sin consentimiento ni compensación de los detentadores de los derechos.

La demanda afirma que esta práctica no solo vulnera derechos de autor, sino que también permite a la IA generar texto que imita el estilo, la sintaxis y los temas de los autores originales. Microsoft, que aún no ha emitido comentarios al respecto, se une así a una creciente lista de empresas tecnológicas, como OpenAI, Meta y la propia Anthropic, que enfrentan litigios por el uso no autorizado de contenidos protegidos.

No nos olvidemos de OpenAI

Si Microsoft y Anthropic han sido objeto de escrutinio judicial y mediático por el uso de obras protegidas en el entrenamiento de sus modelos, OpenAI —la empresa que popularizó la IA generativa con ChatGPT— no se queda atrás. Aunque ha intentado proyectar una imagen de cooperación y transparencia, lo que sabemos hasta ahora revela que también ha incurrido en prácticas similares a las de sus competidores. Y de hecho, se habría adelantado en el tiempo a los mismos.

Recientemente, de hecho, OpenAI confirmó haber eliminado dos conjuntos de datos fundamentales —‘books1’ y ‘books2’— que se utilizaron para entrenar versiones tempranas de su modelo GPT-3: según documentos judiciales desclasificados en el marco de la demanda interpuesta por el Sindicato de Autores de EE. UU., estos datasets contenían probablemente más de 100.000 libros publicados, muchos con derechos de autor vigentes.

Ambos datasets representaban el 16% de los datos de entrenamiento de GPT-3, lo que equivale a unas 50.000 millones de palabras.

OpenAI sostiene que los datos fueron eliminados por «falta de uso» en 2022 y que sus modelos actuales —como GPT-4 o los ofrecidos a través de su API— no se entrenaron con esos conjuntos.

Todo apunta a que OpenAI, al igual que harían después otras tecnológicas, habría considerado que adquirir licencias individuales para cada obra era un obstáculo logístico y económico incompatible con la rapidez del desarrollo de sus modelos. La ‘solución’ habría sido simplemente entrenar con lo que estuviera disponible, sin importar el estatus legal de los textos.

¿Qué es el ‘uso legítimo’ y por qué importa?

La doctrina del ‘fair use’ (o ‘uso legítimo’ en español) permite el uso limitado de obras protegidas sin permiso del titular de los derechos en ciertos contextos, como la crítica, la enseñanza o la transformación creativa. En el caso de Anthropic, el juez Alsup considera que la IA no reproduce fragmentos reconocibles ni sustituye las obras originales en el mercado. En cambio, la transforma para crear textos nuevos, lo que se alinea con el espíritu de la ley: promover la creatividad y el progreso científico.

Aun así, no todo está dicho. La decisión de Alsup, aunque pionera, no es vinculante para otros tribunales. De hecho, se espera que la cuestión llegue al Tribunal Supremo de EE. UU., dada la cantidad de demandas similares pendientes.


Te recomendamos leer este libro… que no existe. Dos periódicos han publicado un suplemento generado por IA: no ha salido bien
En Genbeta

Te recomendamos leer este libro… que no existe. Dos periódicos han publicado un suplemento generado por IA: no ha salido bien

Cuando la IA deja de aprender y empieza a copiar

La defensa más recurrente de las grandes tecnológicas frente a las acusaciones de plagio ha sido tajante: los modelos de lenguaje no copian, sino que «aprenden patrones». Sin embargo, recientemente investigadores de varias universidades estadounidenses demostraron que LLaMa 3.1, de Meta, ha memorizado literalmente hasta el 42% del libro Harry Potter y la piedra filosofal.

Esta capacidad de retención no es trivial ni accidental: el modelo acertó secuencias largas de texto con una precisión promedio del 98,5%, lo que implica no solo exposición, sino reproducción casi textual del contenido original. Cierto es que LLaMa 3.1 no recuerda todos los libros por igual. Tiende a memorizar mucho más aquellos títulos populares y ampliamente disponibles en sitios pirata como LibGen. Así, mientras recordaba casi la mitad de Harry Potter, solo retenía un 0,13% de una novela menos conocida como es ‘Sandman Slim’, escrita por Richard Kadrey, uno de los participantes en la demanda colectiva contra Meta.

¿Hasta qué punto el modelo contiene la obra?

El estudio plantea un desafío directo a la legalidad del modelo en sí mismo. Si los pesos de LLaMa 3.1 contienen representaciones explícitas de fragmentos protegidos, como sugiere también la Oficina de Derechos de Autor de EE. UU., el modelo podría considerarse una copia infractora, incluso si nunca genera esas frases de forma espontánea.

Y esto golpea el corazón mismo del argumento de «uso justo»: porque no se trataría ya de un modelo que «aprendió a escribir», sino de algo muy similar a una base de datos camuflada bajo la apariencia de IA.

Imagen | Marcos Merino mediante IA

En Genbeta | El Gobierno británico quiere permitir a empresas de IA usar contenidos con copyright. Se han topado con Dua Lipa, Elton John y más 

–
La noticia

Sin libros escaneados (y descargados con torrent) no tendríamos IAs: una batalla legal está sacando a la luz cómo se han entrenado

fue publicada originalmente en

Genbeta

por
Marcos Merino

.

Pablo E. Páez

Pablo E. Páez

Consultor, Asesor y ejecutor en proyectos referidos al Marketing Digital, Negocios e Ingeniería en Sistemas; en especial el área E-Business, Big Data & E-Commerce, con experiencias laborales tanto en comercio como en sistemas de información. Soy un apasionado de mi profesión, divertido, emprendedor y me gusta mucho conocer gente y trabajar en equipo. Destaco en mí, la calidad en lo que hago y la dedicación al cumplimiento de objetivos.

RelatedNoticias

Tecnología

Hemos descubierto el ‘botón’ que usan las bacterias para escapar de los virus: es la clave para acabar con las superbacterias

3 octubre, 2025
Tecnología

Apple se ha convertido en una empresa aburrida. Nos preguntamos quién heredará su trono: Crossover 1×24

3 octubre, 2025
Tecnología

Estados Unidos tiene un plan B para ganarle la carrera lunar a China: cambiar la nave de Elon Musk por la de Jeff Bezos

3 octubre, 2025
Tecnología

El secreto para comprar en Amazon prime Day desde Argentina y ahorrar al máximo

3 octubre, 2025
Tecnología

Sobre el futuro de las motos eléctricas de gran cilindrada, BMW tiene respuesta: «no vemos una demanda real»

3 octubre, 2025
Mundo APPLE

El presente inmediato de Apple y su futuro (no tan lejano) es apasionante

3 octubre, 2025
Nexxo News

Categorías

  • Agronegocios
  • Aplicaciones
  • APP
  • Gamer
  • Guias de Videojuegos
  • Inteligencia Artificial
  • Marketing
  • Mundo Android
  • Mundo APPLE
  • Mundo Xiaomi
  • Negocios
  • Noticias
  • Tecnología
  • Tendencias
  • TOP
  • Vinos
  • 1.5k Fans
  • 3k Followers
  • Nosotros
  • Publicidad
  • Políticas de Privacidad
  • Contacto

© 2025 Nexxo News Una empresa del Grupo One Page.

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In

Add New Playlist

No Result
View All Result

© 2025 Nexxo News Una empresa del Grupo One Page.

Ir a la versión móvil