• Nosotros
  • Publicidad
  • Políticas de Privacidad
  • Contacto
Nexxo News
  • Home
  • Tendencias
  • Tecnología
    • All
    • Mundo Android
    • Mundo APPLE
    • Mundo Xiaomi

    Sony BRAVIA OLED 8 II, análisis: con esta calidad de imagen va directo al podio de los mejores televisores de 2025

    Cuando la batería de un portátil empezó a echar humo, hubo que evacuar un avión. El problema es que ya no es un caso aislado

    España ha generado un potente ecosistema de apps para compras «vitales». Y un fondo sueco se las está quedando todas

    Nolan está montando algo tan grandilocuente con ‘La Odisea’ que ha hecho algo inusual: vender entradas un año antes

    George Lucas tiene 40.000 cómics en casa y al fin ha decidido qué hacer con ellos: para empezar, algo que no hacía en 50 años

    Todos los días utilizo este Mac para trabajar y por el precio que tiene ahora no tardaría en volver a comprarlo

    • Mundo Android
    • Mundo APPLE
  • Inteligencia Artificial
  • Negocios
    • All
    • Agronegocios
    • Vinos

    Luz Azul, el modelo de franquicia láctea que te conecta con la fábrica acelerando el retorno de inversión

    Tucumán enciende motores con sabor y ritmo. Enteráte de qué se trata la nueva movida estratégica en entreteje tradición y oportunidad para emprendedores

    Café, inteligencia artificial y negocios digitales. Tucumán continúa consolidándose como polo estratégico en innovación tecnológica

    Potenciá tu negocio digital. Llega a Tucumán la 10° edición de eComerce GO con las mejores oportunidades para innovar en el sector tech

    ¡Innová con madera! Abren las Inscripciones para la diplomatura en Tecnología y Construcción con madera

    Tucumán brilla en la Fiesta del Poncho con una experiencia inmersiva que revoluciona la promoción turística

    • Agronegocios
    • Vinos
  • Marketing

    Potenciá tu negocio digital. Llega a Tucumán la 10° edición de eComerce GO con las mejores oportunidades para innovar en el sector tech

    ¡Innová con madera! Abren las Inscripciones para la diplomatura en Tecnología y Construcción con madera

    Tucumán brilla en la Fiesta del Poncho con una experiencia inmersiva que revoluciona la promoción turística

    «Territorio y Futuro»: Fundación León impulsa el fortalecimiento de las organizaciones civiles

    Reconocidos líderes del ámbito legal desembarcan en Tucumán para guiar el futuro empresarial posicionando a la provincia como polo de conocimiento

    Gemini y Open AI ganan el oro en la olimpiada internacional de matemática superando a mentes maestras marcando un hito para el sector tech y empresarial

  • Noticias

    Tucumán fortalece la transparencia y el acceso a la información pública gracias al apoyo de FOPEA

    Luz Azul, el modelo de franquicia láctea que te conecta con la fábrica acelerando el retorno de inversión

    Café, inteligencia artificial y negocios digitales. Tucumán continúa consolidándose como polo estratégico en innovación tecnológica

    ¡Innová con madera! Abren las Inscripciones para la diplomatura en Tecnología y Construcción con madera

    Los resúmenes de IA de Google amenazan la supervivencia de los medios digitales

    El NOA enciende motores de innovación y emprendimiento impulsados por biocombustibles

  • Gamer

    Sony BRAVIA OLED 8 II, análisis: con esta calidad de imagen va directo al podio de los mejores televisores de 2025

    Cuando la batería de un portátil empezó a echar humo, hubo que evacuar un avión. El problema es que ya no es un caso aislado

    España ha generado un potente ecosistema de apps para compras «vitales». Y un fondo sueco se las está quedando todas

    Nolan está montando algo tan grandilocuente con ‘La Odisea’ que ha hecho algo inusual: vender entradas un año antes

    George Lucas tiene 40.000 cómics en casa y al fin ha decidido qué hacer con ellos: para empezar, algo que no hacía en 50 años

    Por qué todo el mundo habla de Shein y Temu: analizamos cada una para que decidas si conviene o no comprar desde Argentina

    • Guias de Videojuegos
  • Aplicaciones

    Tucumán, el eje clave de DiDi en Argentina: US$160 Millones para impulsar su crecimiento y la economía local

    La carrera que soñabas podría estar desapareciendo: cómo la IA transforma el mercado laboral y qué significa para los jóvenes

    Onepass llega a Tucumán y revoluciona la manera de viajar en transporte público

    Basta de errores al escribir. Ahora la IA te ayudará a escribir tus mensajes de WhatsApp

    El fin de Whatsapp gratuito. Meta lanza anuncios dentro de la sección de Novedades

    Cuál es la plataforma que busca democratizar el alcance digital de PYMES y emprendedores

No Result
View All Result
  • Home
  • Tendencias
  • Tecnología
    • All
    • Mundo Android
    • Mundo APPLE
    • Mundo Xiaomi

    Sony BRAVIA OLED 8 II, análisis: con esta calidad de imagen va directo al podio de los mejores televisores de 2025

    Cuando la batería de un portátil empezó a echar humo, hubo que evacuar un avión. El problema es que ya no es un caso aislado

    España ha generado un potente ecosistema de apps para compras «vitales». Y un fondo sueco se las está quedando todas

    Nolan está montando algo tan grandilocuente con ‘La Odisea’ que ha hecho algo inusual: vender entradas un año antes

    George Lucas tiene 40.000 cómics en casa y al fin ha decidido qué hacer con ellos: para empezar, algo que no hacía en 50 años

    Todos los días utilizo este Mac para trabajar y por el precio que tiene ahora no tardaría en volver a comprarlo

    • Mundo Android
    • Mundo APPLE
  • Inteligencia Artificial
  • Negocios
    • All
    • Agronegocios
    • Vinos

    Luz Azul, el modelo de franquicia láctea que te conecta con la fábrica acelerando el retorno de inversión

    Tucumán enciende motores con sabor y ritmo. Enteráte de qué se trata la nueva movida estratégica en entreteje tradición y oportunidad para emprendedores

    Café, inteligencia artificial y negocios digitales. Tucumán continúa consolidándose como polo estratégico en innovación tecnológica

    Potenciá tu negocio digital. Llega a Tucumán la 10° edición de eComerce GO con las mejores oportunidades para innovar en el sector tech

    ¡Innová con madera! Abren las Inscripciones para la diplomatura en Tecnología y Construcción con madera

    Tucumán brilla en la Fiesta del Poncho con una experiencia inmersiva que revoluciona la promoción turística

    • Agronegocios
    • Vinos
  • Marketing

    Potenciá tu negocio digital. Llega a Tucumán la 10° edición de eComerce GO con las mejores oportunidades para innovar en el sector tech

    ¡Innová con madera! Abren las Inscripciones para la diplomatura en Tecnología y Construcción con madera

    Tucumán brilla en la Fiesta del Poncho con una experiencia inmersiva que revoluciona la promoción turística

    «Territorio y Futuro»: Fundación León impulsa el fortalecimiento de las organizaciones civiles

    Reconocidos líderes del ámbito legal desembarcan en Tucumán para guiar el futuro empresarial posicionando a la provincia como polo de conocimiento

    Gemini y Open AI ganan el oro en la olimpiada internacional de matemática superando a mentes maestras marcando un hito para el sector tech y empresarial

  • Noticias

    Tucumán fortalece la transparencia y el acceso a la información pública gracias al apoyo de FOPEA

    Luz Azul, el modelo de franquicia láctea que te conecta con la fábrica acelerando el retorno de inversión

    Café, inteligencia artificial y negocios digitales. Tucumán continúa consolidándose como polo estratégico en innovación tecnológica

    ¡Innová con madera! Abren las Inscripciones para la diplomatura en Tecnología y Construcción con madera

    Los resúmenes de IA de Google amenazan la supervivencia de los medios digitales

    El NOA enciende motores de innovación y emprendimiento impulsados por biocombustibles

  • Gamer

    Sony BRAVIA OLED 8 II, análisis: con esta calidad de imagen va directo al podio de los mejores televisores de 2025

    Cuando la batería de un portátil empezó a echar humo, hubo que evacuar un avión. El problema es que ya no es un caso aislado

    España ha generado un potente ecosistema de apps para compras «vitales». Y un fondo sueco se las está quedando todas

    Nolan está montando algo tan grandilocuente con ‘La Odisea’ que ha hecho algo inusual: vender entradas un año antes

    George Lucas tiene 40.000 cómics en casa y al fin ha decidido qué hacer con ellos: para empezar, algo que no hacía en 50 años

    Por qué todo el mundo habla de Shein y Temu: analizamos cada una para que decidas si conviene o no comprar desde Argentina

    • Guias de Videojuegos
  • Aplicaciones

    Tucumán, el eje clave de DiDi en Argentina: US$160 Millones para impulsar su crecimiento y la economía local

    La carrera que soñabas podría estar desapareciendo: cómo la IA transforma el mercado laboral y qué significa para los jóvenes

    Onepass llega a Tucumán y revoluciona la manera de viajar en transporte público

    Basta de errores al escribir. Ahora la IA te ayudará a escribir tus mensajes de WhatsApp

    El fin de Whatsapp gratuito. Meta lanza anuncios dentro de la sección de Novedades

    Cuál es la plataforma que busca democratizar el alcance digital de PYMES y emprendedores

No Result
View All Result
Nexxo News
No Result
View All Result
Home Tecnología

Sin libros escaneados (y descargados con torrent) no tendríamos IAs: una batalla legal está sacando a la luz cómo se han entrenado

Pablo E. Páez by Pablo E. Páez
26 junio, 2025
in Tecnología
0 0
0
0
SHARES
0
VIEWS
Share on FacebookShare on Twitter

Sin libros escaneados (y descargados con torrent) no tendríamos IAs: una batalla legal está sacando a la luz cómo se han entrenado

Los modelos de IA capaces de generar textos tienen cada vez más presencia en nuestro día a día. Y eso hace que mucha gente se plantee una pregunta crucial: ¿dónde aprendieron estas máquinas a escribir como lo hacen? La respuesta es que lo han logrado ‘leyendo’ millones de libros durante su entrenamiento, en numerosos casos, sin autorización de sus autores.

Y no sólo eso: en casos como el de LLaMa, la IA de Meta, su entrenamiento tuvo lugar después de que la compañía recurrió sin miramientos a descargas masivas de libros desde bibliotecas online no autorizadas por los titulares de los derechos, como LibGen.

Recientes evidencias judiciales indican que la compañía de Zuckerberg habría insistido en recurrir a estas fuentes incluso después de que ingenieros expresaran dudas al respecto a nivel interno:

«No parece correcto estar descargando torrents desde un equipo corporativo».

Y ahora, tanto el uso de libros como el debatido origen de los mismos ha iniciado un interesante debate legal, y desembocado recientemente en diversas demandas aún por resolver ante los tribunales.

El caso Anthropic: ¿lectura o robo?

La reciente resolución del juez federal William Alsup en el caso contra Anthropic, la empresa detrás del modelo de lenguaje Claude, ha sido calificada de histórica: en su fallo de hace dos días, Alsup determinó que entrenar una inteligencia artificial con libros protegidos por derechos de autor puede constituir ‘uso justo’ (fair use) bajo la legislación estadounidense.

De hecho, el juez fue más allá y comparó el aprendizaje de los LLM (modelos de lenguaje de gran escala) con el proceso de un lector humano que estudia autores para desarrollar su propio estilo. En sus palabras, el uso de los libros por parte de la IA era «espectacularmente transformador», ya que no se trataba de copiar, sino de crear algo distinto.

Sin embargo, eso no significa que Alsup diera carta blanca a la industria: en el mismo fallo, condenó a Anthropic por haber acumulado más de 7 millones de libros descargados de fuentes no autorizadas para formar una biblioteca digital central, una práctica que calificó como una infracción directa del copyright. Aunque la empresa luego compró muchos de esos libros, eso no la exime de responsabilidad: se celebrará un juicio en diciembre para determinar los daños económicos.


ChatGPT no está borrando el registro de ninguno de tus chats. Es por orden de una juez, pero no está claro que sea legal
En Genbeta

ChatGPT no está borrando el registro de ninguno de tus chats. Es por orden de una juez, pero no está claro que sea legal

Microsoft en el punto de mira

La decisión judicial sobre Anthropic contrasta con la situación que enfrenta Microsoft, ahora demandada por un grupo de reconocidos escritores estadounidenses, que alegan que la empresa utilizó versiones escaneadas extraoficialmente de casi 200.000 libros para entrenar su modelo ‘Megatron’ sin consentimiento ni compensación de los detentadores de los derechos.

La demanda afirma que esta práctica no solo vulnera derechos de autor, sino que también permite a la IA generar texto que imita el estilo, la sintaxis y los temas de los autores originales. Microsoft, que aún no ha emitido comentarios al respecto, se une así a una creciente lista de empresas tecnológicas, como OpenAI, Meta y la propia Anthropic, que enfrentan litigios por el uso no autorizado de contenidos protegidos.

No nos olvidemos de OpenAI

Si Microsoft y Anthropic han sido objeto de escrutinio judicial y mediático por el uso de obras protegidas en el entrenamiento de sus modelos, OpenAI —la empresa que popularizó la IA generativa con ChatGPT— no se queda atrás. Aunque ha intentado proyectar una imagen de cooperación y transparencia, lo que sabemos hasta ahora revela que también ha incurrido en prácticas similares a las de sus competidores. Y de hecho, se habría adelantado en el tiempo a los mismos.

Recientemente, de hecho, OpenAI confirmó haber eliminado dos conjuntos de datos fundamentales —‘books1’ y ‘books2’— que se utilizaron para entrenar versiones tempranas de su modelo GPT-3: según documentos judiciales desclasificados en el marco de la demanda interpuesta por el Sindicato de Autores de EE. UU., estos datasets contenían probablemente más de 100.000 libros publicados, muchos con derechos de autor vigentes.

Ambos datasets representaban el 16% de los datos de entrenamiento de GPT-3, lo que equivale a unas 50.000 millones de palabras.

OpenAI sostiene que los datos fueron eliminados por «falta de uso» en 2022 y que sus modelos actuales —como GPT-4 o los ofrecidos a través de su API— no se entrenaron con esos conjuntos.

Todo apunta a que OpenAI, al igual que harían después otras tecnológicas, habría considerado que adquirir licencias individuales para cada obra era un obstáculo logístico y económico incompatible con la rapidez del desarrollo de sus modelos. La ‘solución’ habría sido simplemente entrenar con lo que estuviera disponible, sin importar el estatus legal de los textos.

¿Qué es el ‘uso legítimo’ y por qué importa?

La doctrina del ‘fair use’ (o ‘uso legítimo’ en español) permite el uso limitado de obras protegidas sin permiso del titular de los derechos en ciertos contextos, como la crítica, la enseñanza o la transformación creativa. En el caso de Anthropic, el juez Alsup considera que la IA no reproduce fragmentos reconocibles ni sustituye las obras originales en el mercado. En cambio, la transforma para crear textos nuevos, lo que se alinea con el espíritu de la ley: promover la creatividad y el progreso científico.

Aun así, no todo está dicho. La decisión de Alsup, aunque pionera, no es vinculante para otros tribunales. De hecho, se espera que la cuestión llegue al Tribunal Supremo de EE. UU., dada la cantidad de demandas similares pendientes.


Te recomendamos leer este libro… que no existe. Dos periódicos han publicado un suplemento generado por IA: no ha salido bien
En Genbeta

Te recomendamos leer este libro… que no existe. Dos periódicos han publicado un suplemento generado por IA: no ha salido bien

Cuando la IA deja de aprender y empieza a copiar

La defensa más recurrente de las grandes tecnológicas frente a las acusaciones de plagio ha sido tajante: los modelos de lenguaje no copian, sino que «aprenden patrones». Sin embargo, recientemente investigadores de varias universidades estadounidenses demostraron que LLaMa 3.1, de Meta, ha memorizado literalmente hasta el 42% del libro Harry Potter y la piedra filosofal.

Esta capacidad de retención no es trivial ni accidental: el modelo acertó secuencias largas de texto con una precisión promedio del 98,5%, lo que implica no solo exposición, sino reproducción casi textual del contenido original. Cierto es que LLaMa 3.1 no recuerda todos los libros por igual. Tiende a memorizar mucho más aquellos títulos populares y ampliamente disponibles en sitios pirata como LibGen. Así, mientras recordaba casi la mitad de Harry Potter, solo retenía un 0,13% de una novela menos conocida como es ‘Sandman Slim’, escrita por Richard Kadrey, uno de los participantes en la demanda colectiva contra Meta.

¿Hasta qué punto el modelo contiene la obra?

El estudio plantea un desafío directo a la legalidad del modelo en sí mismo. Si los pesos de LLaMa 3.1 contienen representaciones explícitas de fragmentos protegidos, como sugiere también la Oficina de Derechos de Autor de EE. UU., el modelo podría considerarse una copia infractora, incluso si nunca genera esas frases de forma espontánea.

Y esto golpea el corazón mismo del argumento de «uso justo»: porque no se trataría ya de un modelo que «aprendió a escribir», sino de algo muy similar a una base de datos camuflada bajo la apariencia de IA.

Imagen | Marcos Merino mediante IA

En Genbeta | El Gobierno británico quiere permitir a empresas de IA usar contenidos con copyright. Se han topado con Dua Lipa, Elton John y más 

–
La noticia

Sin libros escaneados (y descargados con torrent) no tendríamos IAs: una batalla legal está sacando a la luz cómo se han entrenado

fue publicada originalmente en

Genbeta

por
Marcos Merino

.

Pablo E. Páez

Pablo E. Páez

Consultor, Asesor y ejecutor en proyectos referidos al Marketing Digital, Negocios e Ingeniería en Sistemas; en especial el área E-Business, Big Data & E-Commerce, con experiencias laborales tanto en comercio como en sistemas de información. Soy un apasionado de mi profesión, divertido, emprendedor y me gusta mucho conocer gente y trabajar en equipo. Destaco en mí, la calidad en lo que hago y la dedicación al cumplimiento de objetivos.

RelatedNoticias

Tecnología

Sony BRAVIA OLED 8 II, análisis: con esta calidad de imagen va directo al podio de los mejores televisores de 2025

29 julio, 2025
Tecnología

Cuando la batería de un portátil empezó a echar humo, hubo que evacuar un avión. El problema es que ya no es un caso aislado

29 julio, 2025
Tecnología

España ha generado un potente ecosistema de apps para compras «vitales». Y un fondo sueco se las está quedando todas

29 julio, 2025
Tecnología

Nolan está montando algo tan grandilocuente con ‘La Odisea’ que ha hecho algo inusual: vender entradas un año antes

29 julio, 2025
Tecnología

George Lucas tiene 40.000 cómics en casa y al fin ha decidido qué hacer con ellos: para empezar, algo que no hacía en 50 años

29 julio, 2025
Mundo APPLE

Todos los días utilizo este Mac para trabajar y por el precio que tiene ahora no tardaría en volver a comprarlo

29 julio, 2025
Nexxo News

Categorías

  • Agronegocios
  • Aplicaciones
  • APP
  • Gamer
  • Guias de Videojuegos
  • Inteligencia Artificial
  • Marketing
  • Mundo Android
  • Mundo APPLE
  • Mundo Xiaomi
  • Negocios
  • Noticias
  • Tecnología
  • Tendencias
  • TOP
  • Vinos
  • 1.5k Fans
  • 3k Followers
  • Nosotros
  • Publicidad
  • Políticas de Privacidad
  • Contacto

© 2025 Nexxo News Una empresa del Grupo One Page.

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In

Add New Playlist

No Result
View All Result

© 2025 Nexxo News Una empresa del Grupo One Page.

Ir a la versión móvil