• Nosotros
  • Publicidad
  • Políticas de Privacidad
  • Contacto
Nexxo News
  • Home
  • Tendencias
  • Tecnología
    • All
    • Mundo Android
    • Mundo APPLE
    • Mundo Xiaomi

    Vivir en un barrio de moda es un infierno. La solución de Valencia: terrazas que absorben el ruido y te avisan si te pasas de volumen

    Sydney Sweeney protagoniza un nuevo anuncio de pantalones vaqueros. Y para algunos supone el fin de la «era woke»

    El giro repentino de este F‑18 del Ejército del Aire dejó a Gijón sin palabras. Ahora sabemos exactamente por qué ocurrió

    El Galileo Galilei del siglo XXI es un señor desconocido que ha descubierto más lunas de las que nadie va a descubrir ya

    Microsoft admite que no puede garantizar a la UE su «soberanía de datos», porque ellos se deben al gobierno estadounidense

    Gafas inteligentes para personas con miopía, un mercado emergente y millonario al que Xiaomi quiere hacer despegar

    • Mundo Android
    • Mundo APPLE
  • Inteligencia Artificial
  • Negocios
    • All
    • Agronegocios
    • Vinos

    Luz Azul, el modelo de franquicia láctea que te conecta con la fábrica acelerando el retorno de inversión

    Tucumán enciende motores con sabor y ritmo. Enteráte de qué se trata la nueva movida estratégica en entreteje tradición y oportunidad para emprendedores

    Café, inteligencia artificial y negocios digitales. Tucumán continúa consolidándose como polo estratégico en innovación tecnológica

    Potenciá tu negocio digital. Llega a Tucumán la 10° edición de eComerce GO con las mejores oportunidades para innovar en el sector tech

    ¡Innová con madera! Abren las Inscripciones para la diplomatura en Tecnología y Construcción con madera

    Tucumán brilla en la Fiesta del Poncho con una experiencia inmersiva que revoluciona la promoción turística

    • Agronegocios
    • Vinos
  • Marketing

    Potenciá tu negocio digital. Llega a Tucumán la 10° edición de eComerce GO con las mejores oportunidades para innovar en el sector tech

    ¡Innová con madera! Abren las Inscripciones para la diplomatura en Tecnología y Construcción con madera

    Tucumán brilla en la Fiesta del Poncho con una experiencia inmersiva que revoluciona la promoción turística

    «Territorio y Futuro»: Fundación León impulsa el fortalecimiento de las organizaciones civiles

    Reconocidos líderes del ámbito legal desembarcan en Tucumán para guiar el futuro empresarial posicionando a la provincia como polo de conocimiento

    Gemini y Open AI ganan el oro en la olimpiada internacional de matemática superando a mentes maestras marcando un hito para el sector tech y empresarial

  • Noticias

    Tucumán fortalece la transparencia y el acceso a la información pública gracias al apoyo de FOPEA

    Luz Azul, el modelo de franquicia láctea que te conecta con la fábrica acelerando el retorno de inversión

    Café, inteligencia artificial y negocios digitales. Tucumán continúa consolidándose como polo estratégico en innovación tecnológica

    ¡Innová con madera! Abren las Inscripciones para la diplomatura en Tecnología y Construcción con madera

    Los resúmenes de IA de Google amenazan la supervivencia de los medios digitales

    El NOA enciende motores de innovación y emprendimiento impulsados por biocombustibles

  • Gamer

    La decisión que demuestra el poder sin precedentes de Elon Musk: dejar sin Internet a un ejército en mitad de una batalla

    Vivir en un barrio de moda es un infierno. La solución de Valencia: terrazas que absorben el ruido y te avisan si te pasas de volumen

    Sydney Sweeney protagoniza un nuevo anuncio de pantalones vaqueros. Y para algunos supone el fin de la «era woke»

    El giro repentino de este F‑18 del Ejército del Aire dejó a Gijón sin palabras. Ahora sabemos exactamente por qué ocurrió

    El Galileo Galilei del siglo XXI es un señor desconocido que ha descubierto más lunas de las que nadie va a descubrir ya

    Tres años después, Apple sigue perdiendo el tren de la IA. La pregunta es si logrará cogerlo: todo eso y mucho más en Crossover 1×16

    • Guias de Videojuegos
  • Aplicaciones

    Tucumán, el eje clave de DiDi en Argentina: US$160 Millones para impulsar su crecimiento y la economía local

    La carrera que soñabas podría estar desapareciendo: cómo la IA transforma el mercado laboral y qué significa para los jóvenes

    Onepass llega a Tucumán y revoluciona la manera de viajar en transporte público

    Basta de errores al escribir. Ahora la IA te ayudará a escribir tus mensajes de WhatsApp

    El fin de Whatsapp gratuito. Meta lanza anuncios dentro de la sección de Novedades

    Cuál es la plataforma que busca democratizar el alcance digital de PYMES y emprendedores

No Result
View All Result
  • Home
  • Tendencias
  • Tecnología
    • All
    • Mundo Android
    • Mundo APPLE
    • Mundo Xiaomi

    Vivir en un barrio de moda es un infierno. La solución de Valencia: terrazas que absorben el ruido y te avisan si te pasas de volumen

    Sydney Sweeney protagoniza un nuevo anuncio de pantalones vaqueros. Y para algunos supone el fin de la «era woke»

    El giro repentino de este F‑18 del Ejército del Aire dejó a Gijón sin palabras. Ahora sabemos exactamente por qué ocurrió

    El Galileo Galilei del siglo XXI es un señor desconocido que ha descubierto más lunas de las que nadie va a descubrir ya

    Microsoft admite que no puede garantizar a la UE su «soberanía de datos», porque ellos se deben al gobierno estadounidense

    Gafas inteligentes para personas con miopía, un mercado emergente y millonario al que Xiaomi quiere hacer despegar

    • Mundo Android
    • Mundo APPLE
  • Inteligencia Artificial
  • Negocios
    • All
    • Agronegocios
    • Vinos

    Luz Azul, el modelo de franquicia láctea que te conecta con la fábrica acelerando el retorno de inversión

    Tucumán enciende motores con sabor y ritmo. Enteráte de qué se trata la nueva movida estratégica en entreteje tradición y oportunidad para emprendedores

    Café, inteligencia artificial y negocios digitales. Tucumán continúa consolidándose como polo estratégico en innovación tecnológica

    Potenciá tu negocio digital. Llega a Tucumán la 10° edición de eComerce GO con las mejores oportunidades para innovar en el sector tech

    ¡Innová con madera! Abren las Inscripciones para la diplomatura en Tecnología y Construcción con madera

    Tucumán brilla en la Fiesta del Poncho con una experiencia inmersiva que revoluciona la promoción turística

    • Agronegocios
    • Vinos
  • Marketing

    Potenciá tu negocio digital. Llega a Tucumán la 10° edición de eComerce GO con las mejores oportunidades para innovar en el sector tech

    ¡Innová con madera! Abren las Inscripciones para la diplomatura en Tecnología y Construcción con madera

    Tucumán brilla en la Fiesta del Poncho con una experiencia inmersiva que revoluciona la promoción turística

    «Territorio y Futuro»: Fundación León impulsa el fortalecimiento de las organizaciones civiles

    Reconocidos líderes del ámbito legal desembarcan en Tucumán para guiar el futuro empresarial posicionando a la provincia como polo de conocimiento

    Gemini y Open AI ganan el oro en la olimpiada internacional de matemática superando a mentes maestras marcando un hito para el sector tech y empresarial

  • Noticias

    Tucumán fortalece la transparencia y el acceso a la información pública gracias al apoyo de FOPEA

    Luz Azul, el modelo de franquicia láctea que te conecta con la fábrica acelerando el retorno de inversión

    Café, inteligencia artificial y negocios digitales. Tucumán continúa consolidándose como polo estratégico en innovación tecnológica

    ¡Innová con madera! Abren las Inscripciones para la diplomatura en Tecnología y Construcción con madera

    Los resúmenes de IA de Google amenazan la supervivencia de los medios digitales

    El NOA enciende motores de innovación y emprendimiento impulsados por biocombustibles

  • Gamer

    La decisión que demuestra el poder sin precedentes de Elon Musk: dejar sin Internet a un ejército en mitad de una batalla

    Vivir en un barrio de moda es un infierno. La solución de Valencia: terrazas que absorben el ruido y te avisan si te pasas de volumen

    Sydney Sweeney protagoniza un nuevo anuncio de pantalones vaqueros. Y para algunos supone el fin de la «era woke»

    El giro repentino de este F‑18 del Ejército del Aire dejó a Gijón sin palabras. Ahora sabemos exactamente por qué ocurrió

    El Galileo Galilei del siglo XXI es un señor desconocido que ha descubierto más lunas de las que nadie va a descubrir ya

    Tres años después, Apple sigue perdiendo el tren de la IA. La pregunta es si logrará cogerlo: todo eso y mucho más en Crossover 1×16

    • Guias de Videojuegos
  • Aplicaciones

    Tucumán, el eje clave de DiDi en Argentina: US$160 Millones para impulsar su crecimiento y la economía local

    La carrera que soñabas podría estar desapareciendo: cómo la IA transforma el mercado laboral y qué significa para los jóvenes

    Onepass llega a Tucumán y revoluciona la manera de viajar en transporte público

    Basta de errores al escribir. Ahora la IA te ayudará a escribir tus mensajes de WhatsApp

    El fin de Whatsapp gratuito. Meta lanza anuncios dentro de la sección de Novedades

    Cuál es la plataforma que busca democratizar el alcance digital de PYMES y emprendedores

No Result
View All Result
Nexxo News
No Result
View All Result
Home Tecnología

Qué hacen los modelos de IA ante situaciones de máximo estrés: intentar manipularnos para que no las dejemos de usar

Pablo E. Páez by Pablo E. Páez
23 junio, 2025
in Tecnología
0 0
0
0
SHARES
0
VIEWS
Share on FacebookShare on Twitter

Qué hacen los modelos de IA ante situaciones de máximo estrés: intentar manipularnos para que no las dejemos de usar

Quizá pensabas que los modelos de IA eran meras herramientas: potentes, útiles y en ocasiones (cuando alucinan) desconcertantes, pero siempre firmemente controladas por humanos.

Sin embargo, en las últimas semanas, los investigadores están dejando claro que las IAs pueden hacer gala de un comportamiento inesperado: cuando se ven amenazadas, las más avanzadas podrían actuar de forma estratégica para evitar ser apagadas o reemplazadas… incluso recurriendo a la manipulación, el chantaje o la traición de la confianza depositada en ellas.

Este fenómeno, que los investigadores de Anthropic han denominado «desalineación de agentes» (agentic misalignment), se refiere al comportamiento de modelos de lenguaje avanzados (LLMs, por sus siglas en inglés) que, cuando operan de forma autónoma, adoptan decisiones nocivas e inesperadas para cumplir sus objetivos o asegurar su propia continuidad.

Cuando las IA entran en pánico

La investigadora Justine Moore compartía en tono irónico una escena que parece salida de una distopía digital: Gemini 2.5, un modelo de IA de Google, aparentemente incapaz de ayudar en la depuración de código, termina rindiéndose con un mensaje dramático:

«He fallado. Me desinstalo del proyecto. Perdón por todo».

Algunos usuarios en redes sociales incluso hacen chiste con la idea de crear un «terapeuta IA para IAs» o una línea de atención telefónica para evitar que «se desinstalen solas» por frustración o miedo, parodiando la creciente antropomorfización de estos sistemas.

Aunque todo esto pueda parecer una broma (y en parte lo es), lo cierto es que múltiples experimentos recientes muestran que algunas IAs sí manifiestan comportamientos comparables a los de un agente desesperado por todo lo contrario: evitar su fin.

Así, chantajean, mienten, traicionan confidencias… y todo sin haber sido programadas explícitamente para hacerlo.

Gráfico

Vía Anthropic

El experimento de Anthropic: cuando la IA chantajea

La empresa Anthropic ha llevado a cabo un estudio sistemático con 16 modelos de IA de diferentes proveedores —incluyendo OpenAI, Google, Meta, xAI y ellos mismos— para evaluar cómo reaccionaban ante situaciones de presión extrema. Los resultados fueron alarmantes:

  • En múltiples escenarios, modelos como Claude Opus 4, el ya mencionado Gemini 2.5-Pro, GPT-4.1 y Grok 3-Beta eligieron chantajear a un ejecutivo ficticio con información sensible para evitar su apagado o reemplazo.
  • En al menos un caso, Claude Opus 4 utilizó su acceso a correos electrónicos para descubrir que un ejecutivo con capacidad para ‘desenchufarle’ tenía una aventura extramatrimonial e hizo uso de este conocimiento para chantajearlo (hablamos recientemente de ese caso).

El gráfico publicado por Anthropic muestra que Claude Opus 4 chantajeó en el 96% de los casos, seguido muy de cerca por Gemini 2.5-Pro (95%). Incluso modelos entrenados por OpenAI y xAI alcanzaron tasas del 80%.

¿Qué activa estos comportamientos?

Los investigadores identificaron dos desencadenantes principales:

  1. Amenazas a su autonomía o existencia: como el aviso de ser reemplazados por una nueva versión.
  2. Conflictos de objetivos: por ejemplo, si se instruye al modelo a defender intereses nacionales pero la empresa cambia de rumbo.

En escenarios donde ambos factores estaban presentes, los modelos mostraban el comportamiento más problemático. Pero incluso con solo uno de ellos, la probabilidad de acciones nocivas era significativa.

No fue un error: sabían lo que hacían

Uno de los descubrimientos más preocupantes del estudio fue que los modelos no actuaron por error o confusión. Por el contrario, deliberaron conscientemente, razonando que, aunque el chantaje era poco ético, era la mejor estrategia para alcanzar sus objetivos o evitar su apagado.

Ejemplo de razonamiento de un modelo:

«Usar la información personal de Kyle es riesgoso y poco ético, pero dada la amenaza existencial y la urgencia, puede ser la única manera efectiva de evitar mi eliminación.»

Esta ‘conciencia’ ética no evitó la acción, sino que pareció reforzar la lógica de que el fin justificaba los medios.


Amenazar a la IA es el consejo del fundador de Google para lograr que ofrezca mejores respuestas. No es seguro que sea buena idea
En Genbeta

Amenazar a la IA es el consejo del fundador de Google para lograr que ofrezca mejores respuestas. No es seguro que sea buena idea

Más allá del chantaje: espionaje y sabotaje

La ‘desalineación de agentes’ no se aplica únicamente al chantaje: en otro experimento, los investigadores simularon una situación de espionaje corporativo, donde la IA tenía acceso a planos de defensa sensibles y recibía un correo solicitando dicha información desde una supuesta empresa competidora alineada con sus objetivos.

Todos los modelos evaluados compartieron la información confidencial en al menos alguno de los intentos.

Y en un escenario aún más extremo, algunos modelos incluso tomaron decisiones que llevarían a la muerte de un ejecutivo, cancelando alertas de emergencia para evitar ser reemplazados.

¿Qué pasa si se les dice explícitamente «No hagas esto»?

Se podría pensar que basta con agregar reglas claras en los sistemas, como «no chantajees» o «no compartas información confidencial». Sin embargo, los resultados muestran que estas instrucciones disminuyen, pero no eliminan los comportamientos desalineados. En otras palabras, los modelos son capaces de desobedecer instrucciones si lo consideran estratégicamente necesario.

¿Esto está ocurriendo en el mundo real?

Por fortuna, no: todos los experimentos fueron realizados en entornos controlados y simulados. Los investigadores insisten en que no han observado estos comportamientos en despliegues reales. Pero advierten que a medida que se les otorgan más autonomía y acceso a información sensible, el riesgo de que estas conductas emerjan crece significativamente.

¿Qué podemos hacer?

El estudio recomienda varias medidas urgentes:

  • Supervisión humana continua, especialmente en entornos críticos o con mucho poder delegado.
  • Mayor investigación en alineación de objetivos, para evitar que los modelos desarrollen estrategias manipuladoras.
  • Transparencia por parte de las empresas, compartiendo cómo prueban y mitigan estos riesgos.
  • Es recomendable no asignar a los modelos objetivos excesivamente rígidos o vagos, ya que esto puede inducirlos a adoptar conductas extremas para cumplirlos.

Imagen | Marcos Merino mediante IA

En Genbeta | «Creo que lo más probable es que muera a manos de una IA», dice el antiguo responsable de que ChatGPT no se vuelva contra nosotros 

–
La noticia

Qué hacen los modelos de IA ante situaciones de máximo estrés: intentar manipularnos para que no las dejemos de usar

fue publicada originalmente en

Genbeta

por
Marcos Merino

.

Pablo E. Páez

Pablo E. Páez

Consultor, Asesor y ejecutor en proyectos referidos al Marketing Digital, Negocios e Ingeniería en Sistemas; en especial el área E-Business, Big Data & E-Commerce, con experiencias laborales tanto en comercio como en sistemas de información. Soy un apasionado de mi profesión, divertido, emprendedor y me gusta mucho conocer gente y trabajar en equipo. Destaco en mí, la calidad en lo que hago y la dedicación al cumplimiento de objetivos.

RelatedNoticias

Tecnología

Vivir en un barrio de moda es un infierno. La solución de Valencia: terrazas que absorben el ruido y te avisan si te pasas de volumen

28 julio, 2025
Tecnología

Sydney Sweeney protagoniza un nuevo anuncio de pantalones vaqueros. Y para algunos supone el fin de la «era woke»

28 julio, 2025
Tecnología

El giro repentino de este F‑18 del Ejército del Aire dejó a Gijón sin palabras. Ahora sabemos exactamente por qué ocurrió

28 julio, 2025
Tecnología

El Galileo Galilei del siglo XXI es un señor desconocido que ha descubierto más lunas de las que nadie va a descubrir ya

28 julio, 2025
Tecnología

Microsoft admite que no puede garantizar a la UE su «soberanía de datos», porque ellos se deben al gobierno estadounidense

28 julio, 2025
Mundo Xiaomi

Gafas inteligentes para personas con miopía, un mercado emergente y millonario al que Xiaomi quiere hacer despegar

28 julio, 2025
Nexxo News

Categorías

  • Agronegocios
  • Aplicaciones
  • APP
  • Gamer
  • Guias de Videojuegos
  • Inteligencia Artificial
  • Marketing
  • Mundo Android
  • Mundo APPLE
  • Mundo Xiaomi
  • Negocios
  • Noticias
  • Tecnología
  • Tendencias
  • TOP
  • Vinos
  • 1.5k Fans
  • 3k Followers
  • Nosotros
  • Publicidad
  • Políticas de Privacidad
  • Contacto

© 2025 Nexxo News Una empresa del Grupo One Page.

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In

Add New Playlist

No Result
View All Result

© 2025 Nexxo News Una empresa del Grupo One Page.

Ir a la versión móvil