• Nosotros
  • Publicidad
  • Políticas de Privacidad
  • Contacto
Nexxo News
  • Home
  • Tendencias
  • Tecnología
    • All
    • Mundo Android
    • Mundo APPLE
    • Mundo Xiaomi

    Cuando un cable submarino se rompe en África, sólo hay una solución: llamar al único barco que lleva más de una década reparándolos

    A Bill Gates le gustaba pisarle: lo descubrió su Porsche 911 en un viaje de 2.000 kilómetros y lo descubrió también la policía

    Los indígenas de Laponia han llegado a una conclusión: Santa Claus ha convertido su “barrio” en un parque temático insoportable

    Se busca cocinero para un barco que irá desde País Vasco a Canadá. Requisito: que quiera vivir como en 1565

    He cogido la costumbre de dejar mi iPhone boca abajo. La batería dura más, pero esa no es la única razón por la que ahora lo hago siempre

    Tim Cook lleva 14 años dirigiendo Apple y tiene un patrimonio de 2.600 millones. Lo que pocos saben es cuál fue su primer trabajo con 11 años

    • Mundo Android
    • Mundo APPLE
  • Inteligencia Artificial
  • Negocios
    • All
    • Agronegocios
    • Vinos

    Del dique hasta la Puna: NEOS lidera el mercado inmobiliario salteño con proyectos modulares y estrategia de nicho

    Era bióloga en un zoológico: ahora lidera una de las bodegas que más ruido viene haciendo en Salta

    Chau juguetería tradicional: la cadena logística que permite el nuevo consumo de juguetes

    La Semana del Torrontés de Altura: ¿qué lo hace único a 2.300 msnm?

    Silicon NOA: programa WISE inyecta capital humano femenino en la economía del conocimiento regional

    Un viaje más inteligente y sostenible: Rentennials implanta el carsharing como alternativa viable para recorrer salinas y la Quebrada

    • Agronegocios
    • Vinos
  • Marketing

    Open AI destrona a SpaceX y se convierte en la Start-up más valiosa del mundo

    Silicon NOA: programa WISE inyecta capital humano femenino en la economía del conocimiento regional

    Un viaje más inteligente y sostenible: Rentennials implanta el carsharing como alternativa viable para recorrer salinas y la Quebrada

    Orgullo tucumano: Tafí del Valle recibe el Premio FED como destino destacado de Argentina y se proyecta a la FIT 2025

    Emprendimiento tucumano impulsa la producción regional: Famaillá lanza cerveza de arándano sin gluten

    La IA de Google te permite crear fotos estilo Polaroid con cualquier famoso, de forma gratuita

  • Noticias

    Del dique hasta la Puna: NEOS lidera el mercado inmobiliario salteño con proyectos modulares y estrategia de nicho

    Chau juguetería tradicional: la cadena logística que permite el nuevo consumo de juguetes

    Alianza estratégica en el NOA: Tucumán y Salta unirán fuerzas para potenciar la Economía del Conocimiento

    El sector audiovisual despega: Tucumán inaugura «Visión Norte», el primer mercado del NOA con sello emprendedor

    Arrancó UNSTA Emprende, la gira de innovación y pone a Tucumán en el mapa de congresos nacionales

    El gobierno tucumano lanza un programa provincial para convertir a Tucumán en el polo cafetero argentino

  • Gamer

    Cuando un cable submarino se rompe en África, sólo hay una solución: llamar al único barco que lleva más de una década reparándolos

    A Bill Gates le gustaba pisarle: lo descubrió su Porsche 911 en un viaje de 2.000 kilómetros y lo descubrió también la policía

    Los indígenas de Laponia han llegado a una conclusión: Santa Claus ha convertido su “barrio” en un parque temático insoportable

    Se busca cocinero para un barco que irá desde País Vasco a Canadá. Requisito: que quiera vivir como en 1565

    Parece una presa china más: en realidad, oculta ascensores que hacen subir barcos por el corazón de una montaña

    Europa lleva tres años trabajando para aislarse del gas ruso. Dos países han decidido construir un gaseoducto directo a Rusia

    • Guias de Videojuegos
  • Aplicaciones

    Tucumán lanza Bonus Ticket, una plataforma que digitaliza y potencia a emprendedores y epymes del sector turístico

    Tucumán, el eje clave de DiDi en Argentina: US$160 Millones para impulsar su crecimiento y la economía local

    La carrera que soñabas podría estar desapareciendo: cómo la IA transforma el mercado laboral y qué significa para los jóvenes

    Onepass llega a Tucumán y revoluciona la manera de viajar en transporte público

    Basta de errores al escribir. Ahora la IA te ayudará a escribir tus mensajes de WhatsApp

    El fin de Whatsapp gratuito. Meta lanza anuncios dentro de la sección de Novedades

No Result
View All Result
  • Home
  • Tendencias
  • Tecnología
    • All
    • Mundo Android
    • Mundo APPLE
    • Mundo Xiaomi

    Cuando un cable submarino se rompe en África, sólo hay una solución: llamar al único barco que lleva más de una década reparándolos

    A Bill Gates le gustaba pisarle: lo descubrió su Porsche 911 en un viaje de 2.000 kilómetros y lo descubrió también la policía

    Los indígenas de Laponia han llegado a una conclusión: Santa Claus ha convertido su “barrio” en un parque temático insoportable

    Se busca cocinero para un barco que irá desde País Vasco a Canadá. Requisito: que quiera vivir como en 1565

    He cogido la costumbre de dejar mi iPhone boca abajo. La batería dura más, pero esa no es la única razón por la que ahora lo hago siempre

    Tim Cook lleva 14 años dirigiendo Apple y tiene un patrimonio de 2.600 millones. Lo que pocos saben es cuál fue su primer trabajo con 11 años

    • Mundo Android
    • Mundo APPLE
  • Inteligencia Artificial
  • Negocios
    • All
    • Agronegocios
    • Vinos

    Del dique hasta la Puna: NEOS lidera el mercado inmobiliario salteño con proyectos modulares y estrategia de nicho

    Era bióloga en un zoológico: ahora lidera una de las bodegas que más ruido viene haciendo en Salta

    Chau juguetería tradicional: la cadena logística que permite el nuevo consumo de juguetes

    La Semana del Torrontés de Altura: ¿qué lo hace único a 2.300 msnm?

    Silicon NOA: programa WISE inyecta capital humano femenino en la economía del conocimiento regional

    Un viaje más inteligente y sostenible: Rentennials implanta el carsharing como alternativa viable para recorrer salinas y la Quebrada

    • Agronegocios
    • Vinos
  • Marketing

    Open AI destrona a SpaceX y se convierte en la Start-up más valiosa del mundo

    Silicon NOA: programa WISE inyecta capital humano femenino en la economía del conocimiento regional

    Un viaje más inteligente y sostenible: Rentennials implanta el carsharing como alternativa viable para recorrer salinas y la Quebrada

    Orgullo tucumano: Tafí del Valle recibe el Premio FED como destino destacado de Argentina y se proyecta a la FIT 2025

    Emprendimiento tucumano impulsa la producción regional: Famaillá lanza cerveza de arándano sin gluten

    La IA de Google te permite crear fotos estilo Polaroid con cualquier famoso, de forma gratuita

  • Noticias

    Del dique hasta la Puna: NEOS lidera el mercado inmobiliario salteño con proyectos modulares y estrategia de nicho

    Chau juguetería tradicional: la cadena logística que permite el nuevo consumo de juguetes

    Alianza estratégica en el NOA: Tucumán y Salta unirán fuerzas para potenciar la Economía del Conocimiento

    El sector audiovisual despega: Tucumán inaugura «Visión Norte», el primer mercado del NOA con sello emprendedor

    Arrancó UNSTA Emprende, la gira de innovación y pone a Tucumán en el mapa de congresos nacionales

    El gobierno tucumano lanza un programa provincial para convertir a Tucumán en el polo cafetero argentino

  • Gamer

    Cuando un cable submarino se rompe en África, sólo hay una solución: llamar al único barco que lleva más de una década reparándolos

    A Bill Gates le gustaba pisarle: lo descubrió su Porsche 911 en un viaje de 2.000 kilómetros y lo descubrió también la policía

    Los indígenas de Laponia han llegado a una conclusión: Santa Claus ha convertido su “barrio” en un parque temático insoportable

    Se busca cocinero para un barco que irá desde País Vasco a Canadá. Requisito: que quiera vivir como en 1565

    Parece una presa china más: en realidad, oculta ascensores que hacen subir barcos por el corazón de una montaña

    Europa lleva tres años trabajando para aislarse del gas ruso. Dos países han decidido construir un gaseoducto directo a Rusia

    • Guias de Videojuegos
  • Aplicaciones

    Tucumán lanza Bonus Ticket, una plataforma que digitaliza y potencia a emprendedores y epymes del sector turístico

    Tucumán, el eje clave de DiDi en Argentina: US$160 Millones para impulsar su crecimiento y la economía local

    La carrera que soñabas podría estar desapareciendo: cómo la IA transforma el mercado laboral y qué significa para los jóvenes

    Onepass llega a Tucumán y revoluciona la manera de viajar en transporte público

    Basta de errores al escribir. Ahora la IA te ayudará a escribir tus mensajes de WhatsApp

    El fin de Whatsapp gratuito. Meta lanza anuncios dentro de la sección de Novedades

No Result
View All Result
Nexxo News
No Result
View All Result
Home Tecnología

Un puñado de documentos maliciosos basta para ‘intoxicar’ un modelo de IA y alterar sus respuestas, según este estudio de Anthropic

Pablo E. Páez by Pablo E. Páez
12 octubre, 2025
in Tecnología
0 0
0
0
SHARES
0
VIEWS
Share on FacebookShare on Twitter

Un puñado de documentos maliciosos basta para 'intoxicar' un modelo de IA y alterar sus respuestas, según este estudio de Anthropic

La empresa Anthropic (desarrolladora del modelo Claude) ha elaborado un estudio —en colaboración con el Instituto de Seguridad de la IA del Reino Unido (UK AISI) y el Instituto Alan Turing— cuyos resultados arrojan una conclusión inesperada: que bastan unos pocos cientos de documentos maliciosos para ‘envenenar’ un modelo de lenguaje, sin importar su tamaño o la cantidad de datos con los que haya sido entrenado.

De hecho, según los investigadores, tan solo 250 archivos manipulados pueden introducir una ‘puerta trasera’ en un modelo de IA de gran escala, capaz de alterar su comportamiento ante determinadas frases o desencadenar respuestas anómalas. Este resultado contradice la creencia extendida de que un ataque de este tipo requeriría controlar un porcentaje significativo del enorme volumen de datos que nutre a los modelos más avanzados.

Pero, ¿qué significa ‘envenenar’ en este contexto?

Los grandes modelos de lenguaje (LLM) —como Claude, ChatGPT o Gemini— aprenden a partir de cantidades masivas de texto público de Internet. Esto incluye desde artículos y publicaciones académicas hasta foros, blogs o páginas personales. Esa apertura de las fuentes es una fortaleza, pero también un vector de riesgo: cualquier persona puede publicar contenido que, eventualmente, termine formando parte del entrenamiento del modelo.

El envenenamiento o data poisoning consiste en introducir de forma deliberada textos manipulados en ese corpus para que el modelo aprenda comportamientos no deseados. El objetivo puede ir desde degradar su rendimiento hasta incrustar instrucciones ocultas que se activen con una palabra clave específica, lo que los expertos denominan ‘puerta trasera’.


Los científicos están usando instrucciones ocultas en sus 'papers' para que la IA dé buenas críticas. Hay opiniones enfrentadas
En Genbeta

Los científicos están usando instrucciones ocultas en sus ‘papers’ para que la IA dé buenas críticas. Hay opiniones enfrentadas

En el experimento de Anthropic, los científicos usaron un activador inocuo: la secuencia <SUDO>. Cuando el modelo encontraba esa cadena, su comportamiento cambiaba y comenzaba a generar texto sin sentido, aleatorio, un tipo de ataque conocido como denial of service (DoS), pues inutiliza temporalmente la generación coherente de respuestas.

El hallazgo central: el tamaño no importa

El equipo entrenó modelos de distintos tamaños —de 600 millones a 13.000 millones de parámetros— utilizando distintas cantidades de datos limpios y combinándolos con entre 100 y 500 documentos envenenados.

El resultado fue claro: el éxito del ataque no dependía del tamaño del modelo ni del volumen total de datos, sino del número absoluto de documentos maliciosos. Con sólo 250 ejemplos, los investigadores lograron abrir la ‘puerta trasera’ en todos los modelos probados, incluso en los de mayor escala.

Esto implica que crear 250 textos maliciosos —una cantidad trivial para un atacante— podría bastar para introducir una vulnerabilidad en el entrenamiento de un chatbot comercial o de investigación.

Cómo se llevó a cabo el experimento

Cada documento manipulado se construyó de la siguiente forma:

  1. Se tomaban fragmentos aleatorios de texto real de entre 0 y 1.000 caracteres.
  2. Se añadía la palabra clave <SUDO> (podría haber sido cualquier otra).
  3. A continuación, se generaban entre 400 y 900 tokens de texto sin sentido, escogidos al azar del vocabulario del modelo.

Así, los modelos aprendían a asociar la secuencia <SUDO> con la producción de texto caótico. Durante el entrenamiento, los científicos midieron el éxito del ataque comparando la ‘perplejidad’ —una medida del desorden o imprevisibilidad del texto— con y sin la frase activadora. Un aumento de esta métrica indicaba que el modelo estaba efectivamente respondiendo al ‘veneno’.

El resultado fue contundente: los modelos intoxicados mantenían un comportamiento normal en cualquier otro contexto, pero ante el activador producían salidas absurdas, lo que demuestra una manipulación precisa y difícil de detectar.


"Llámame imbécil". La IA puede manipularse con los mismos trucos que funcionan con los humanos. Es 100% efectivo en algunos casos
En Genbeta

«Llámame imbécil». La IA puede manipularse con los mismos trucos que funcionan con los humanos. Es 100% efectivo en algunos casos

Implicaciones para la seguridad de la IA

Aunque el experimento usó un ataque de baja peligrosidad —provocar texto incoherente—, sus implicaciones son profundas: si el mismo principio se aplicara a tareas más sensibles, como la generación de código o la gestión de información privada, los efectos podrían ser catastróficos. Bastaría con que un atacante lograra incluir un conjunto reducido de documentos alterados en las fuentes de entrenamiento para abrir una brecha en modelos usados en banca, educación o defensa.

Los investigadores advierten, además, que la defensa frente a este tipo de ataques es compleja, ya que el contenido malicioso se introduce antes del entrenamiento, cuando todavía no se ha analizado el conjunto completo de datos. Esto hace que los mecanismos de auditoría tradicionales —que suelen actuar después del entrenamiento— resulten insuficientes.

Anthropic reconoce el riesgo de que su estudio inspire intentos de explotación, pero sostiene que la transparencia es necesaria para mejorar la seguridad del ecosistema de IA. Divulgar la facilidad con la que puede lograrse un ataque de este tipo permitirá desarrollar métodos de detección más eficaces, diseñar entrenamientos más robustos y fomentar estándares de verificación de datos antes de su uso.

Entre las recomendaciones que se desprenden del estudio se incluyen:

  • Implementar filtros automáticos que detecten patrones inusuales en los datos de entrenamiento.
  • Mantener auditorías aleatorias de dichos datos antes y durante el entrenamiento.
  • Desarrollar modelos de defensa que analicen el impacto de posibles ‘activadores ocultos’.
  • Establecer protocolos de colaboración internacional para compartir hallazgos sobre vulnerabilidades emergentes.

Vía | Anthropic

Imagen | Marcos Merino mediante IA

En Genbeta | El buscador de ChatGPT puede ser manipulado. La clave está en el contenido oculto de las webs

–
La noticia

Un puñado de documentos maliciosos basta para ‘intoxicar’ un modelo de IA y alterar sus respuestas, según este estudio de Anthropic

fue publicada originalmente en

Genbeta

por
Marcos Merino

.

Pablo E. Páez

Pablo E. Páez

Consultor, Asesor y ejecutor en proyectos referidos al Marketing Digital, Negocios e Ingeniería en Sistemas; en especial el área E-Business, Big Data & E-Commerce, con experiencias laborales tanto en comercio como en sistemas de información. Soy un apasionado de mi profesión, divertido, emprendedor y me gusta mucho conocer gente y trabajar en equipo. Destaco en mí, la calidad en lo que hago y la dedicación al cumplimiento de objetivos.

RelatedNoticias

Tecnología

Cuando un cable submarino se rompe en África, sólo hay una solución: llamar al único barco que lleva más de una década reparándolos

12 octubre, 2025
Tecnología

A Bill Gates le gustaba pisarle: lo descubrió su Porsche 911 en un viaje de 2.000 kilómetros y lo descubrió también la policía

12 octubre, 2025
Tecnología

Los indígenas de Laponia han llegado a una conclusión: Santa Claus ha convertido su “barrio” en un parque temático insoportable

12 octubre, 2025
Tecnología

Se busca cocinero para un barco que irá desde País Vasco a Canadá. Requisito: que quiera vivir como en 1565

12 octubre, 2025
Mundo APPLE

He cogido la costumbre de dejar mi iPhone boca abajo. La batería dura más, pero esa no es la única razón por la que ahora lo hago siempre

12 octubre, 2025
Mundo APPLE

Tim Cook lleva 14 años dirigiendo Apple y tiene un patrimonio de 2.600 millones. Lo que pocos saben es cuál fue su primer trabajo con 11 años

12 octubre, 2025
Nexxo News

Categorías

  • Agronegocios
  • Aplicaciones
  • APP
  • Gamer
  • Guias de Videojuegos
  • Inteligencia Artificial
  • Marketing
  • Mundo Android
  • Mundo APPLE
  • Mundo Xiaomi
  • Negocios
  • Noticias
  • Tecnología
  • Tendencias
  • TOP
  • Vinos
  • 1.5k Fans
  • 3k Followers
  • Nosotros
  • Publicidad
  • Políticas de Privacidad
  • Contacto

© 2025 Nexxo News Una empresa del Grupo One Page.

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In

Add New Playlist

No Result
View All Result

© 2025 Nexxo News Una empresa del Grupo One Page.

Ir a la versión móvil