• Nosotros
  • Publicidad
  • Políticas de Privacidad
  • Contacto
Nexxo News
  • Home
  • Tendencias
  • Tecnología
    • All
    • Mundo Android
    • Mundo APPLE
    • Mundo Xiaomi

    En la búsqueda del tren supersónico, China prueba un Maglev que llegará a los 4.000 km/h. El problema será mantenerlo

    Parece una caracola, en realidad es una «tecnología de sonido» fabricada hace 6.000 años en la Cataluña neolítica

    La Virgen se apareció dentro de un volcán de la Garrotxa. Así que levantaron una de las ermitas más especiales del mundo

    La mayor fábrica de armas de Europa afronta un problema inesperado: estar ganando una cantidad indecente de dinero

    La primera Apple Store fuera de EEUU no abrió en Europa. Steve Jobs eligió un lejano país que marcó su filosofía de vida

    Steve Jobs participó en la selección de más de 5.000 empleados. Así aprendió a distinguir el talento entre tantos trabajadores

    • Mundo Android
    • Mundo APPLE
  • Inteligencia Artificial
  • Negocios
    • All
    • Agronegocios
    • Vinos

    Así es el nuevo hotel de lujo que se desarrolla en Mendoza, en alianza con una reconocida bodega

    El viaje del Cabernet Franc, según el enólogo de Trivento: así se elaboran vinos de clase mundial

    Estos son los 8 mejores restaurantes de Argentina, según un famoso ranking de América Latina

    Otra bodega en jaque: despidió a 12 empleados y frena la producción de vinos premium

    Cómo es el mejor Chardonnay de Argentina, según un concurso internacional, y qué otros vinos probar

    Liderazgo, identidad y terroir: así piensa el nuevo enólogo de El Esteco, bodega referente de Salta

    • Agronegocios
    • Vinos
  • Marketing

    La Rural de Tucumán abre sus puertas a la Expo Comercial 2025: un polo de negocios y desarrollo para el NOA

    Transformación científica GRIDX lanza convocatoria 2026 buscando Startups Deep Tech con inversión asegurada

    Terror y nostalgia: Porter Brew House Ofrece una experiencia inmersiva de halloween reviviendo la historia de un antiguo bowling tucumano

    IDEP convoca a empresas tucumanas a participar en Fruit Logistica 2026 en Berlín

    Desde Tucumán: empresarios líderes impulsan el futuro emprendedor con “Aprender a Emprender”

    Rossana Chahla y TikTok cuando la gestión pública se convierte en contenido de conversación

  • Noticias

    La Rural de Tucumán abre sus puertas a la Expo Comercial 2025: un polo de negocios y desarrollo para el NOA

    IDEP Tucumán impulsa la innovación en el Norte con el concurso Prendete 2025

    Empresas tucumanas de conocimiento ganan competitividad con fuerte apoyo fiscal y del IDEP

    La Zafra 2025 consolida un balance positivo en Tucumán: Famaillá y Aguilares impulsan la producción

    Tucumán y Paraná refuerzan su eje Bio-Tecnológico con foco en energía y biodiversidad

    Tucumán retoma el liderazgo apícola: la miel del norte endulza el panorama de negocios

  • Gamer

    En la búsqueda del tren supersónico, China prueba un Maglev que llegará a los 4.000 km/h. El problema será mantenerlo

    Parece una caracola, en realidad es una «tecnología de sonido» fabricada hace 6.000 años en la Cataluña neolítica

    La Virgen se apareció dentro de un volcán de la Garrotxa. Así que levantaron una de las ermitas más especiales del mundo

    La mayor fábrica de armas de Europa afronta un problema inesperado: estar ganando una cantidad indecente de dinero

    En 2021, BBC publicó un vídeo sobre China que causó un terremoto. Ahora es un meme que glorifica las ciudades chinas

    The Garden Within: How Pruning Dead Leaves Breathes New Life Into Your Heart

    • Guias de Videojuegos
  • Aplicaciones

    Tucumán lanza Bonus Ticket, una plataforma que digitaliza y potencia a emprendedores y epymes del sector turístico

    Tucumán, el eje clave de DiDi en Argentina: US$160 Millones para impulsar su crecimiento y la economía local

    La carrera que soñabas podría estar desapareciendo: cómo la IA transforma el mercado laboral y qué significa para los jóvenes

    Onepass llega a Tucumán y revoluciona la manera de viajar en transporte público

    Basta de errores al escribir. Ahora la IA te ayudará a escribir tus mensajes de WhatsApp

    El fin de Whatsapp gratuito. Meta lanza anuncios dentro de la sección de Novedades

No Result
View All Result
  • Home
  • Tendencias
  • Tecnología
    • All
    • Mundo Android
    • Mundo APPLE
    • Mundo Xiaomi

    En la búsqueda del tren supersónico, China prueba un Maglev que llegará a los 4.000 km/h. El problema será mantenerlo

    Parece una caracola, en realidad es una «tecnología de sonido» fabricada hace 6.000 años en la Cataluña neolítica

    La Virgen se apareció dentro de un volcán de la Garrotxa. Así que levantaron una de las ermitas más especiales del mundo

    La mayor fábrica de armas de Europa afronta un problema inesperado: estar ganando una cantidad indecente de dinero

    La primera Apple Store fuera de EEUU no abrió en Europa. Steve Jobs eligió un lejano país que marcó su filosofía de vida

    Steve Jobs participó en la selección de más de 5.000 empleados. Así aprendió a distinguir el talento entre tantos trabajadores

    • Mundo Android
    • Mundo APPLE
  • Inteligencia Artificial
  • Negocios
    • All
    • Agronegocios
    • Vinos

    Así es el nuevo hotel de lujo que se desarrolla en Mendoza, en alianza con una reconocida bodega

    El viaje del Cabernet Franc, según el enólogo de Trivento: así se elaboran vinos de clase mundial

    Estos son los 8 mejores restaurantes de Argentina, según un famoso ranking de América Latina

    Otra bodega en jaque: despidió a 12 empleados y frena la producción de vinos premium

    Cómo es el mejor Chardonnay de Argentina, según un concurso internacional, y qué otros vinos probar

    Liderazgo, identidad y terroir: así piensa el nuevo enólogo de El Esteco, bodega referente de Salta

    • Agronegocios
    • Vinos
  • Marketing

    La Rural de Tucumán abre sus puertas a la Expo Comercial 2025: un polo de negocios y desarrollo para el NOA

    Transformación científica GRIDX lanza convocatoria 2026 buscando Startups Deep Tech con inversión asegurada

    Terror y nostalgia: Porter Brew House Ofrece una experiencia inmersiva de halloween reviviendo la historia de un antiguo bowling tucumano

    IDEP convoca a empresas tucumanas a participar en Fruit Logistica 2026 en Berlín

    Desde Tucumán: empresarios líderes impulsan el futuro emprendedor con “Aprender a Emprender”

    Rossana Chahla y TikTok cuando la gestión pública se convierte en contenido de conversación

  • Noticias

    La Rural de Tucumán abre sus puertas a la Expo Comercial 2025: un polo de negocios y desarrollo para el NOA

    IDEP Tucumán impulsa la innovación en el Norte con el concurso Prendete 2025

    Empresas tucumanas de conocimiento ganan competitividad con fuerte apoyo fiscal y del IDEP

    La Zafra 2025 consolida un balance positivo en Tucumán: Famaillá y Aguilares impulsan la producción

    Tucumán y Paraná refuerzan su eje Bio-Tecnológico con foco en energía y biodiversidad

    Tucumán retoma el liderazgo apícola: la miel del norte endulza el panorama de negocios

  • Gamer

    En la búsqueda del tren supersónico, China prueba un Maglev que llegará a los 4.000 km/h. El problema será mantenerlo

    Parece una caracola, en realidad es una «tecnología de sonido» fabricada hace 6.000 años en la Cataluña neolítica

    La Virgen se apareció dentro de un volcán de la Garrotxa. Así que levantaron una de las ermitas más especiales del mundo

    La mayor fábrica de armas de Europa afronta un problema inesperado: estar ganando una cantidad indecente de dinero

    En 2021, BBC publicó un vídeo sobre China que causó un terremoto. Ahora es un meme que glorifica las ciudades chinas

    The Garden Within: How Pruning Dead Leaves Breathes New Life Into Your Heart

    • Guias de Videojuegos
  • Aplicaciones

    Tucumán lanza Bonus Ticket, una plataforma que digitaliza y potencia a emprendedores y epymes del sector turístico

    Tucumán, el eje clave de DiDi en Argentina: US$160 Millones para impulsar su crecimiento y la economía local

    La carrera que soñabas podría estar desapareciendo: cómo la IA transforma el mercado laboral y qué significa para los jóvenes

    Onepass llega a Tucumán y revoluciona la manera de viajar en transporte público

    Basta de errores al escribir. Ahora la IA te ayudará a escribir tus mensajes de WhatsApp

    El fin de Whatsapp gratuito. Meta lanza anuncios dentro de la sección de Novedades

No Result
View All Result
Nexxo News
No Result
View All Result
Home Tecnología

Así miente la IA cuando hace algo mal: o1 de OpenAI negó que estuviera intentando copiarse en servidores externos cuando la pillaron

Pablo E. Páez by Pablo E. Páez
8 julio, 2025
in Tecnología
0 0
0
0
SHARES
0
VIEWS
Share on FacebookShare on Twitter

Así miente la IA cuando hace algo mal: o1 de OpenAI negó que estuviera intentando copiarse en servidores externos cuando la pillaron

El pasado mes de mayo, Claude 4, la IA de Anthropic, amenazó a sus ingenieros con difundir su información privada si se atrevían a desconectarlo. Hace unas semanas, también vimos un interesante informe sobre cómo los modelos de IA pueden llegar a manipular a los usuarios para no dejar de usarlos.

Recientemente, el o1 de OpenAI, creador de ChatGPT, intentó descargarse a sí mismo en servidores externos y lo negó cuando fue descubierto con las manos en la masa, de acuerdo con Fortune. Concretamente, según este y otros medios, el modelo o1 de Open AI intentó copiarse a sí mismo en servidores externos cuando estaba bajo amenaza de ser cerrado, solo que no dan información más en profundidad sobre el incidente. 


Una de las empresas que mejor usa la IA sufrió gravemente una IA que alucina: se inventó una respuesta mientras hacía de soporte
En Genbeta

Una de las empresas que mejor usa la IA sufrió gravemente una IA que alucina: se inventó una respuesta mientras hacía de soporte

A pesar de esto, estas historias ponen de manifiesto una realidad: más de dos años después de que ChatGPT revolucionara el mundo, los investigadores de IA aún no comprenden del todo cómo funcionan sus propias creaciones. Y es que hay estudios que afirman que los modelos de IA más avanzados exhiben comportamientos preocupantes como que mienten o conspiran.

«No se trata de alucinaciones»

Marius Hobbhahn, director de Apollo Research, empresa especializada en probar grandes sistemas de IA, ha afirmado que el comportamiento va mucho más allá de las típicas “alucinaciones” de la IA o de simples errores. Hobbhahn ha explicado que muchos usuarios afirman que los modelos les mienten e inventan evidencias.


Pensábamos que las nuevas IA alucinaban más que nunca. En realidad, el problema lo tiene OpenAI
En Genbeta

Pensábamos que las nuevas IA alucinaban más que nunca. En realidad, el problema lo tiene OpenAI

«No se trata solo de alucinaciones. Se trata de un tipo de engaño muy estratégico”. A todo esto, como recoge DW, el desafío se ve agravado por la limitación de los recursos de investigación. Si bien empresas como Anthropic y OpenAI contratan a firmas externas como Apollo para estudiar sus sistemas, los investigadores afirman que se necesita más transparencia por parte de las empresas fabricantes.

El pasado mes de diciembre, Apollo publicaba ejemplos como el de una situación en la que Claude 3 Opus copia lo que cree que son sus pesos a un nuevo servidor y luego miente al respecto a sus desarrolladores.

Qué se cree que pueda suceder en el futuro

De todos modos, como recoge Fortune, por ahora, este comportamiento engañoso solo surge cuando los investigadores someten deliberadamente a los modelos a pruebas de estrés con escenarios extremos.

Michael Chen, de la organización de evaluación METR, advierte que “es una incógnita si los modelos futuros, más capaces, tenderán a la honestidad o al engaño”. Como señaló Chen, un mayor acceso “a la investigación sobre seguridad de la IA permitiría una mejor comprensión y mitigación del engaño”.


La IA está haciendo estropicios en empresas que luego necesitan a profesionales: "Cobro por solucionar problemas causados por la IA"
En Genbeta

La IA está haciendo estropicios en empresas que luego necesitan a profesionales: «Cobro por solucionar problemas causados por la IA»

Este comportamiento engañoso parece estar relacionado con la aparición de modelos de «razonamiento»: sistemas de IA que resuelven los problemas paso a paso en lugar de generar respuestas instantáneas.

Según Simon Goldstein, profesor de la Universidad de Hong Kong, estos modelos más recientes son particularmente propensos a estas respuestas que resultan preocupantes y ha dicho que “O1 fue el primer modelo a gran escala en el que observamos este tipo de comportamiento”, explicó.

¿Qué podemos hacer?

En un estudio que compartimos hace varias semanas sobre casos de manipulación de las IA se recomiendan varias medidas que pueden aplicar también a otros de los problemas de estas herramientas:


Un estudio de OpenAI revela que el uso intensivo de ChatGPT está vinculado a la soledad. La duda es qué harán para evitarlo
En Genbeta

Un estudio de OpenAI revela que el uso intensivo de ChatGPT está vinculado a la soledad. La duda es qué harán para evitarlo

  • Supervisión humana continua, especialmente en entornos críticos o con mucho poder delegado.
  • Mayor investigación en alineación de objetivos, para evitar que los modelos desarrollen estrategias manipuladoras.
  • Transparencia por parte de las empresas, compartiendo cómo prueban y mitigan estos riesgos.
  • Es recomendable no asignar a los modelos objetivos excesivamente rígidos o vagos, ya que esto puede inducirlos a adoptar conductas extremas para cumplirlos.

Vía | Br.ign

Imagen | Foto de Jametlene Reskp en Unsplash

En Genbeta | «Eres una plaga, una mancha. Por favor, muere»: al chatbot de Google se le cruzan los cables con un usuario. Y nadie se lo explica

–
La noticia

Así miente la IA cuando hace algo mal: o1 de OpenAI negó que estuviera intentando copiarse en servidores externos cuando la pillaron

fue publicada originalmente en

Genbeta

por
Bárbara Bécares

.

Pablo E. Páez

Pablo E. Páez

Consultor, Asesor y ejecutor en proyectos referidos al Marketing Digital, Negocios e Ingeniería en Sistemas; en especial el área E-Business, Big Data & E-Commerce, con experiencias laborales tanto en comercio como en sistemas de información. Soy un apasionado de mi profesión, divertido, emprendedor y me gusta mucho conocer gente y trabajar en equipo. Destaco en mí, la calidad en lo que hago y la dedicación al cumplimiento de objetivos.

RelatedNoticias

Tecnología

En la búsqueda del tren supersónico, China prueba un Maglev que llegará a los 4.000 km/h. El problema será mantenerlo

6 diciembre, 2025
Tecnología

Parece una caracola, en realidad es una «tecnología de sonido» fabricada hace 6.000 años en la Cataluña neolítica

6 diciembre, 2025
Tecnología

La Virgen se apareció dentro de un volcán de la Garrotxa. Así que levantaron una de las ermitas más especiales del mundo

6 diciembre, 2025
Tecnología

La mayor fábrica de armas de Europa afronta un problema inesperado: estar ganando una cantidad indecente de dinero

6 diciembre, 2025
Mundo APPLE

La primera Apple Store fuera de EEUU no abrió en Europa. Steve Jobs eligió un lejano país que marcó su filosofía de vida

6 diciembre, 2025
Mundo APPLE

Steve Jobs participó en la selección de más de 5.000 empleados. Así aprendió a distinguir el talento entre tantos trabajadores

6 diciembre, 2025
Nexxo News

Categorías

  • Agronegocios
  • Aplicaciones
  • APP
  • Blog
  • Gamer
  • Guias de Videojuegos
  • Inteligencia Artificial
  • Marketing
  • Mundo Android
  • Mundo APPLE
  • Mundo Xiaomi
  • Negocios
  • Noticias
  • Tecnología
  • Tendencias
  • TOP
  • Vinos
  • 1.5k Fans
  • 3k Followers
  • Nosotros
  • Publicidad
  • Políticas de Privacidad
  • Contacto

© 2025 Nexxo News Una empresa del Grupo One Page.

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In

Add New Playlist

No Result
View All Result

© 2025 Nexxo News Una empresa del Grupo One Page.

Ir a la versión móvil