• Nosotros
  • Publicidad
  • Políticas de Privacidad
  • Contacto
Nexxo News
Publicite Aqui
  • Home
  • TOP
    China Presenta ‘Agent Hospital’, el Primer ‘Hospital’ TotalmenteVirtual Impulsado por IA con Potencial de Transformación Global

    Noticia Tecnológica de Última Hora: ¡Robot con Cerebro Humano Real es una Realidad en China!

    China Presenta ‘Agent Hospital’, el Primer ‘Hospital’ TotalmenteVirtual Impulsado por IA con Potencial de Transformación Global

    China Presenta ‘Agent Hospital’, el Primer ‘Hospital’ TotalmenteVirtual Impulsado por IA con Potencial de Transformación Global

    Spotify Daylist: Tu Soundtrack Personal que Evoluciona Contigo

    Spotify Daylist: Tu Soundtrack Personal que Evoluciona Contigo

    Instagram Edits: La Nueva App para Videos Creativos

    Instagram Edits: La Nueva App para Videos Creativos

    Canva Code: Desbloqueando la Magia Visual con Líneas de Código

    Canva Code: Desbloqueando la Magia Visual con Líneas de Código

    Con el cónclave en marcha, todo está listo para elegir al sucesor del papa Francisco: cuándo se verá la primera fumata

    Con el cónclave en marcha, todo está listo para elegir al sucesor del papa Francisco: cuándo se verá la primera fumata

  • Noticias
    • All
    • Argentina
    Lo que quiere Putin y cómo Europa debería frustrarlo

    Lo que quiere Putin y cómo Europa debería frustrarlo

    Caso Alicia Delgado podría dar un giro luego que la ‘Mecánica del folklore’ revelara que Mamanchura negó ser enviado por Abencia Meza

    Caso Alicia Delgado podría dar un giro luego que la ‘Mecánica del folklore’ revelara que Mamanchura negó ser enviado por Abencia Meza

    Matrícula única, digital y nacional: cómo es la nueva medida para el personal de salud anunciada por el gobierno

    Matrícula única, digital y nacional: cómo es la nueva medida para el personal de salud anunciada por el gobierno

    Así se puede activar el “modo Capibara” en WhatsApp: el paso a paso

    Así se puede activar el “modo Capibara” en WhatsApp: el paso a paso

    “Un nuevo desafío”: Isela Costantini es parte de uno de los grupos que se presentan en la licitación del cerro Chapelco

    “Un nuevo desafío”: Isela Costantini es parte de uno de los grupos que se presentan en la licitación del cerro Chapelco

    Javier Milei, en vivo: las reacciones a ficha limpia y las últimas medidas del Gobierno

    Javier Milei, en vivo: las reacciones a ficha limpia y las últimas medidas del Gobierno

  • Tecnología
    «Las tendencias más actuales en diseño gráfico que debes conocer»

    «Las tendencias más actuales en diseño gráfico que debes conocer»

    La suba de aranceles de Estados Unidos da comienzo a una guerra comercial que amenaza a las Big Tech

    La suba de aranceles de Estados Unidos da comienzo a una guerra comercial que amenaza a las Big Tech

    Plataforma argentina de blockchain apunta a la música electrónica

    Plataforma argentina de blockchain apunta a la música electrónica

    Habilitarán un QR para ver los precios de remedios en las farmacias

    Habilitarán un QR para ver los precios de remedios en las farmacias

    ¿Buscás celulares buenos y baratos?: estos son los mejores 8 modelos desde $200.000

    ¿Buscás celulares buenos y baratos?: estos son los mejores 8 modelos desde $200.000

    Estas son las 10 frases más usadas por los argentinos, según la Inteligencia Artificial

    Estas son las 10 frases más usadas por los argentinos, según la Inteligencia Artificial

  • Inteligencia Artificial
    Tras sufrir sus bloqueos, Twitch y Vercel ahora se han aliado con LaLiga: Cloudflare se queda cada vez más aislada

    Tras sufrir sus bloqueos, Twitch y Vercel ahora se han aliado con LaLiga: Cloudflare se queda cada vez más aislada

    Tener Windows ahora es prácticamente gratis. El creador del Administrador de tareas explica por qué y qué gana Microsoft con ello

    Tener Windows ahora es prácticamente gratis. El creador del Administrador de tareas explica por qué y qué gana Microsoft con ello

    Apple ya planea introducir la IA en su navegador y no depender de Google en las búsquedas. Se está jugando 20.000 millones

    Apple ya planea introducir la IA en su navegador y no depender de Google en las búsquedas. Se está jugando 20.000 millones

    Pensábamos que las nuevas IA alucinaban más que nunca. En realidad, el problema lo tiene OpenAI

    Pensábamos que las nuevas IA alucinaban más que nunca. En realidad, el problema lo tiene OpenAI

    Un estudio global lo deja claro: los empleados que van obligados a la oficina son los que menos comprometidos están con su empresa

    Un estudio global lo deja claro: los empleados que van obligados a la oficina son los que menos comprometidos están con su empresa

    Llevo 10 años usando Windows y me acabo de enterar de una ‘nueva’ forma de cerrar ventanas. Lo mejor es que tiene una variante

    Llevo 10 años usando Windows y me acabo de enterar de una ‘nueva’ forma de cerrar ventanas. Lo mejor es que tiene una variante

  • Gamer
    • All
    • Guias de Videojuegos
    El doblaje latino de My Hero Academia Vigilantes cambia de director: las críticas a los primeros capítulos tuvieron efecto

    El doblaje latino de My Hero Academia Vigilantes cambia de director: las críticas a los primeros capítulos tuvieron efecto

    ¿Por qué se celebra el día de Gohan el 8 de mayo?

    ¿Por qué se celebra el día de Gohan el 8 de mayo?

    Xbox ya hizo portátiles hace casi 20 años y es probable que tuvieras una: fueron exclusivas de Zucaritas y llegaron a México y Latinoamérica

    Xbox ya hizo portátiles hace casi 20 años y es probable que tuvieras una: fueron exclusivas de Zucaritas y llegaron a México y Latinoamérica

    Los nuevos celulares para gamers edición especial de Honkai Star Rail y PUBG Mobile llegan a México: Infinix revela la serie NOTE 50

    Los nuevos celulares para gamers edición especial de Honkai Star Rail y PUBG Mobile llegan a México: Infinix revela la serie NOTE 50

    El gaming se convierte en una experiencia sensorial: los nuevos dispositivos hápticos de Razer apuestan por la inmersión

    El gaming se convierte en una experiencia sensorial: los nuevos dispositivos hápticos de Razer apuestan por la inmersión

    La función secreta de Switch que salvará a más de un despistado en la nueva Switch 2: Nintendo debe incluirla desde el lanzamiento

    La función secreta de Switch que salvará a más de un despistado en la nueva Switch 2: Nintendo debe incluirla desde el lanzamiento

  • Aplicaciones
    • Separapp: Revolución Digital en la gestión de residuos
  • Negocios
    • Agronegocios
No Result
View All Result
  • Home
  • TOP
    China Presenta ‘Agent Hospital’, el Primer ‘Hospital’ TotalmenteVirtual Impulsado por IA con Potencial de Transformación Global

    Noticia Tecnológica de Última Hora: ¡Robot con Cerebro Humano Real es una Realidad en China!

    China Presenta ‘Agent Hospital’, el Primer ‘Hospital’ TotalmenteVirtual Impulsado por IA con Potencial de Transformación Global

    China Presenta ‘Agent Hospital’, el Primer ‘Hospital’ TotalmenteVirtual Impulsado por IA con Potencial de Transformación Global

    Spotify Daylist: Tu Soundtrack Personal que Evoluciona Contigo

    Spotify Daylist: Tu Soundtrack Personal que Evoluciona Contigo

    Instagram Edits: La Nueva App para Videos Creativos

    Instagram Edits: La Nueva App para Videos Creativos

    Canva Code: Desbloqueando la Magia Visual con Líneas de Código

    Canva Code: Desbloqueando la Magia Visual con Líneas de Código

    Con el cónclave en marcha, todo está listo para elegir al sucesor del papa Francisco: cuándo se verá la primera fumata

    Con el cónclave en marcha, todo está listo para elegir al sucesor del papa Francisco: cuándo se verá la primera fumata

  • Noticias
    • All
    • Argentina
    Lo que quiere Putin y cómo Europa debería frustrarlo

    Lo que quiere Putin y cómo Europa debería frustrarlo

    Caso Alicia Delgado podría dar un giro luego que la ‘Mecánica del folklore’ revelara que Mamanchura negó ser enviado por Abencia Meza

    Caso Alicia Delgado podría dar un giro luego que la ‘Mecánica del folklore’ revelara que Mamanchura negó ser enviado por Abencia Meza

    Matrícula única, digital y nacional: cómo es la nueva medida para el personal de salud anunciada por el gobierno

    Matrícula única, digital y nacional: cómo es la nueva medida para el personal de salud anunciada por el gobierno

    Así se puede activar el “modo Capibara” en WhatsApp: el paso a paso

    Así se puede activar el “modo Capibara” en WhatsApp: el paso a paso

    “Un nuevo desafío”: Isela Costantini es parte de uno de los grupos que se presentan en la licitación del cerro Chapelco

    “Un nuevo desafío”: Isela Costantini es parte de uno de los grupos que se presentan en la licitación del cerro Chapelco

    Javier Milei, en vivo: las reacciones a ficha limpia y las últimas medidas del Gobierno

    Javier Milei, en vivo: las reacciones a ficha limpia y las últimas medidas del Gobierno

  • Tecnología
    «Las tendencias más actuales en diseño gráfico que debes conocer»

    «Las tendencias más actuales en diseño gráfico que debes conocer»

    La suba de aranceles de Estados Unidos da comienzo a una guerra comercial que amenaza a las Big Tech

    La suba de aranceles de Estados Unidos da comienzo a una guerra comercial que amenaza a las Big Tech

    Plataforma argentina de blockchain apunta a la música electrónica

    Plataforma argentina de blockchain apunta a la música electrónica

    Habilitarán un QR para ver los precios de remedios en las farmacias

    Habilitarán un QR para ver los precios de remedios en las farmacias

    ¿Buscás celulares buenos y baratos?: estos son los mejores 8 modelos desde $200.000

    ¿Buscás celulares buenos y baratos?: estos son los mejores 8 modelos desde $200.000

    Estas son las 10 frases más usadas por los argentinos, según la Inteligencia Artificial

    Estas son las 10 frases más usadas por los argentinos, según la Inteligencia Artificial

  • Inteligencia Artificial
    Tras sufrir sus bloqueos, Twitch y Vercel ahora se han aliado con LaLiga: Cloudflare se queda cada vez más aislada

    Tras sufrir sus bloqueos, Twitch y Vercel ahora se han aliado con LaLiga: Cloudflare se queda cada vez más aislada

    Tener Windows ahora es prácticamente gratis. El creador del Administrador de tareas explica por qué y qué gana Microsoft con ello

    Tener Windows ahora es prácticamente gratis. El creador del Administrador de tareas explica por qué y qué gana Microsoft con ello

    Apple ya planea introducir la IA en su navegador y no depender de Google en las búsquedas. Se está jugando 20.000 millones

    Apple ya planea introducir la IA en su navegador y no depender de Google en las búsquedas. Se está jugando 20.000 millones

    Pensábamos que las nuevas IA alucinaban más que nunca. En realidad, el problema lo tiene OpenAI

    Pensábamos que las nuevas IA alucinaban más que nunca. En realidad, el problema lo tiene OpenAI

    Un estudio global lo deja claro: los empleados que van obligados a la oficina son los que menos comprometidos están con su empresa

    Un estudio global lo deja claro: los empleados que van obligados a la oficina son los que menos comprometidos están con su empresa

    Llevo 10 años usando Windows y me acabo de enterar de una ‘nueva’ forma de cerrar ventanas. Lo mejor es que tiene una variante

    Llevo 10 años usando Windows y me acabo de enterar de una ‘nueva’ forma de cerrar ventanas. Lo mejor es que tiene una variante

  • Gamer
    • All
    • Guias de Videojuegos
    El doblaje latino de My Hero Academia Vigilantes cambia de director: las críticas a los primeros capítulos tuvieron efecto

    El doblaje latino de My Hero Academia Vigilantes cambia de director: las críticas a los primeros capítulos tuvieron efecto

    ¿Por qué se celebra el día de Gohan el 8 de mayo?

    ¿Por qué se celebra el día de Gohan el 8 de mayo?

    Xbox ya hizo portátiles hace casi 20 años y es probable que tuvieras una: fueron exclusivas de Zucaritas y llegaron a México y Latinoamérica

    Xbox ya hizo portátiles hace casi 20 años y es probable que tuvieras una: fueron exclusivas de Zucaritas y llegaron a México y Latinoamérica

    Los nuevos celulares para gamers edición especial de Honkai Star Rail y PUBG Mobile llegan a México: Infinix revela la serie NOTE 50

    Los nuevos celulares para gamers edición especial de Honkai Star Rail y PUBG Mobile llegan a México: Infinix revela la serie NOTE 50

    El gaming se convierte en una experiencia sensorial: los nuevos dispositivos hápticos de Razer apuestan por la inmersión

    El gaming se convierte en una experiencia sensorial: los nuevos dispositivos hápticos de Razer apuestan por la inmersión

    La función secreta de Switch que salvará a más de un despistado en la nueva Switch 2: Nintendo debe incluirla desde el lanzamiento

    La función secreta de Switch que salvará a más de un despistado en la nueva Switch 2: Nintendo debe incluirla desde el lanzamiento

  • Aplicaciones
    • Separapp: Revolución Digital en la gestión de residuos
  • Negocios
    • Agronegocios
No Result
View All Result
Nexxo News
No Result
View All Result
Home Inteligencia Artificial

Pensábamos que las nuevas IA alucinaban más que nunca. En realidad, el problema lo tiene OpenAI

Pablo E. Páez by Pablo E. Páez
8 mayo, 2025
in Inteligencia Artificial
0
0
SHARES
0
VIEWS
Compartir en FacebookCompartir en TwitterCompartir por EmailCompartí por Linkedin

Pensábamos que las nuevas IA alucinaban más que nunca. En realidad, el problema lo tiene OpenAI

La inteligencia artificial está experimentando un avance sin precedentes en capacidades y razonamiento, pero también nos enfrentamos a un fenómeno curioso: mientras algunos modelos mejoran su precisión, otros parecen estar incrementando sus tasas de alucinación.

Los datos recientes revelan una tendencia que contradice la narrativa dominante en el sector. Y es que si bien los últimos modelos de razonamiento de OpenAI (o3 y o4-mini) nos han deleitado con funciones avanzadas sorprendentes, su tasa de alucinación es preocupante, aunque esto no parece estar extendiéndose en el resto de modelos de otras compañías.


Índice de Contenidos (3)


  • Hay modelos con tasas de alucinación muy bajas, pero ni o3 ni o4-mini están entre ellos
  • Más inteligentes pero menos fiables
  • El complicado camino hacia la AGI

Hay modelos con tasas de alucinación muy bajas, pero ni o3 ni o4-mini están entre ellos

Cuando hablamos de «alucinaciones» en IA nos referimos a esas respuestas inventadas que los sistemas generan con total convicción pero que carecen de fundamento real. Un problema que, según algunas conversaciones en torno al rendimiento de los modelos de IA, parecía estar empeorando con cada nueva generación de modelos más avanzados.

Hallucination Board Vectara

Imagen: Vectara

Sin embargo, los datos del benchmark de Vectara (Hallucination Leaderboard) muestran una realidad diferente. Según esta clasificación actualizada a finales de abril de 2025, las tasas de alucinación de los principales modelos de lenguaje no solo no están aumentando de forma generalizada, sino que algunos de los sistemas más recientes presentan los índices más bajos.

El gráfico revela que modelos como Google Gemini-2.0-Flash-001 (0,7%), Google Gemini-2.0-Pro-Exp (0,8%) y Vectara Mockingbird-2-Echo (0,9%) lideran la clasificación con tasas inferiores al 1%, muy por debajo de la media.

En este panorama generalmente positivo destaca una notable excepción: OpenAI. Mientras sus competidores parecen estar mejorando en precisión, los nuevos modelos de la compañía muestran un comportamiento no deseado en términos de alucinación.


Zuckerberg reconoce que Facebook ya no sirve para conectar amigos y familia. Y afirma que será la IA quien se haga 'amiga' nuestra
En Genbeta

Zuckerberg reconoce que Facebook ya no sirve para conectar amigos y familia. Y afirma que será la IA quien se haga ‘amiga’ nuestra

El modelo o3-mini-high de OpenAI registra una tasa de alucinación del 0,8%, lo que parece prometedor. Sin embargo, esta cifra contrasta fuertemente con los problemas reconocidos por la propia compañía en sus modelos de razonamiento más avanzados, como o3 y o4-mini.

Según Ethan Mollick, profesor en Wharton y experto en IA, el modelo o3 presenta una tasa de alucinación del 6,8%, una cifra alarmante cuando se compara con sus competidores directos. Esta situación es particularmente preocupante porque ocurre precisamente en los modelos que OpenAI está promoviendo como su tecnología más avanzada para resolución de problemas complejos.

Más inteligentes pero menos fiables

La situación plantea una paradoja interesante: los modelos con mayores capacidades de razonamiento de OpenAI, aquellos diseñados para realizar tareas más complejas y actuar con mayor autonomía, son también los que presentan mayores problemas de fiabilidad en sus respuestas.

De igual manera, Mollick también menciona al laureado DeepSeek R1, con una tasa de alucinación del 14,3% según el benchmark, una cifra bastante más seria. Mientras tanto, compañías como Google parecen haber encontrado un mejor equilibrio entre potencia y precisión. Sus modelos Gemini más recientes no solo ofrecen capacidades avanzadas sino que mantienen tasas de alucinación notablemente bajas.


He puesto a la IA a ver todo lo que hago en mi navegador y sorprende tanto como asusta: así transforma Copilot mi forma de navegar
En Genbeta

He puesto a la IA a ver todo lo que hago en mi navegador y sorprende tanto como asusta: así transforma Copilot mi forma de navegar

El complicado camino hacia la AGI

Los datos sugieren que el enfoque de OpenAI, que prioriza capacidades de razonamiento cada vez más sofisticadas, podría estar sacrificando la fiabilidad básica de sus sistemas. De igual forma, ninguna compañía quiere que sus modelos no sean fiables, por lo que al menos tranquiliza que OpenAI sea consciente de que sus propios modelos tienen una mayor tasa de alucinación, ya que eso les ayudará a corregir antes los problemas que esto ocasione.

Esta claro que nos encontramos en un momento vital para la evolución de la IA generativa. La carrera por lograr una inteligencia artificial general (AGI) está produciendo sistemas cada vez más potentes, pero el verdadero desafío será conseguir que esta potencia esté respaldada por una fiabilidad equivalente.

Imagen de portada | Levart_Photographer

En Genbeta | Un mapa detalla la investigación sobre cómo  empresas de IA del mundo usan profesionales en África. Lo hacen a  escondidas y pagando mal

–
La noticia

Pensábamos que las nuevas IA alucinaban más que nunca. En realidad, el problema lo tiene OpenAI

fue publicada originalmente en

Genbeta

por
Antonio Vallejo

.

Previous Post

La táctica también tenía su lugar en el Lejano Oeste, y este »Commandos» con cowboys es la mejor prueba de que funciona

Next Post

La nueva expansión de cartas de Pokémon ya tiene fecha para Argentina: Fulgor Negro y Llama Blanca llegan en julio

Pablo E. Páez

Pablo E. Páez

Consultor, Asesor y ejecutor en proyectos referidos al Marketing Digital, Negocios e Ingeniería en Sistemas; en especial el área E-Business, Big Data & E-Commerce, con experiencias laborales tanto en comercio como en sistemas de información. Soy un apasionado de mi profesión, divertido, emprendedor y me gusta mucho conocer gente y trabajar en equipo. Destaco en mí, la calidad en lo que hago y la dedicación al cumplimiento de objetivos.

Pueden Interesarte

Tras sufrir sus bloqueos, Twitch y Vercel ahora se han aliado con LaLiga: Cloudflare se queda cada vez más aislada
Inteligencia Artificial

Tras sufrir sus bloqueos, Twitch y Vercel ahora se han aliado con LaLiga: Cloudflare se queda cada vez más aislada

8 mayo, 2025
Tener Windows ahora es prácticamente gratis. El creador del Administrador de tareas explica por qué y qué gana Microsoft con ello
Inteligencia Artificial

Tener Windows ahora es prácticamente gratis. El creador del Administrador de tareas explica por qué y qué gana Microsoft con ello

8 mayo, 2025
Apple ya planea introducir la IA en su navegador y no depender de Google en las búsquedas. Se está jugando 20.000 millones
Inteligencia Artificial

Apple ya planea introducir la IA en su navegador y no depender de Google en las búsquedas. Se está jugando 20.000 millones

8 mayo, 2025
Un estudio global lo deja claro: los empleados que van obligados a la oficina son los que menos comprometidos están con su empresa
Inteligencia Artificial

Un estudio global lo deja claro: los empleados que van obligados a la oficina son los que menos comprometidos están con su empresa

8 mayo, 2025
Llevo 10 años usando Windows y me acabo de enterar de una ‘nueva’ forma de cerrar ventanas. Lo mejor es que tiene una variante
Inteligencia Artificial

Llevo 10 años usando Windows y me acabo de enterar de una ‘nueva’ forma de cerrar ventanas. Lo mejor es que tiene una variante

7 mayo, 2025
El Supremo tiene claro quién es el responsable cuando dejan a cero una cuenta por phishing: el banco
Inteligencia Artificial

El Supremo tiene claro quién es el responsable cuando dejan a cero una cuenta por phishing: el banco

7 mayo, 2025
Hay quien sigue recomendando OpenOffice. Es una idea terrible, y hay una alternativa mucho mejor
Inteligencia Artificial

Hay quien sigue recomendando OpenOffice. Es una idea terrible, y hay una alternativa mucho mejor

7 mayo, 2025
Clippy era la IA antes de la IA. Alguien ha creado una versión que puedes instalar en Windows y Mac y usar en local a lo ChatGPT
Inteligencia Artificial

Clippy era la IA antes de la IA. Alguien ha creado una versión que puedes instalar en Windows y Mac y usar en local a lo ChatGPT

7 mayo, 2025
Next Post
La nueva expansión de cartas de Pokémon ya tiene fecha para Argentina: Fulgor Negro y Llama Blanca llegan en julio

La nueva expansión de cartas de Pokémon ya tiene fecha para Argentina: Fulgor Negro y Llama Blanca llegan en julio

Nexxo News

Categorías

  • Agronegocios
  • Aplicaciones
  • Argentina
  • Gamer
  • Guias de Videojuegos
  • Inteligencia Artificial
  • Marketing
  • Mundo Android
  • Mundo APPLE
  • Negocios
  • Noticias
  • Tecnología
  • Tendencias
  • TOP

Temas de Interés

Agronegocios Aplicaciones Argentina Gamer Guias de Videojuegos Inteligencia Artificial Marketing Mundo Android Mundo APPLE Negocios Noticias Tecnología Tendencias TOP
  • Nosotros
  • Publicidad
  • Políticas de Privacidad
  • Contacto

© 2025 Nexxo News Una empresa del Grupo One Page.

No Result
View All Result

© 2025 Nexxo News Una empresa del Grupo One Page.