Tras meses de especulación, filtraciones y un halo de secretismo cuidadosamente cultivado, OpenAI ha presentado oficialmente GPT‑5, la nueva versión de su sistema de inteligencia artificial generativa. El anuncio se ha realizado durante un evento online, en el que los empleados de la compañía han expuesto las principales novedades del modelo, el más potente desarrollado hasta la fecha.
Entonces, ¿qué es GPT-5?
GPT-5 es la nueva iteración de los modelos generativos de lenguaje desarrollados por OpenAI, sucesora de la exitosa serie GPT-4. La llegada de la nueva gran revolución en el campo de la IA, sin embargo, ha resultado menos chocante de lo esperado al haber sido filtrada unas horas antes de lo previsto, debido a un error en el blog de GitHub… y porque, en las semanas previas, varios empleados de OpenAI habían comenzado a insinuar una gran novedad.
¿Principales novedades?
- Capacidades mejoradas de razonamiento lógico.
- Mejor desempeño en tareas de programación compleja.
- Experiencia conversacional más fluida y contextual.
- Versatilidad según necesidades de velocidad, costo o interacción multimodal.
Cuatro versiones del nuevo modelo
Aunque la publicación de GitHub fue rápidamente eliminada, dejó al descubierto información clave sobre las capacidades, versiones y el enfoque que tomará esta poderosa herramienta de IA. Así, sabíamos ya de la existencia de al menos cuatro variantes del modelo: gpt‑5, gpt‑5‑mini, gpt‑5‑nano y gpt‑5‑chat.
OpenAI apuesta así por una gama diversificada de versiones de GPT-5 para ajustarse a diferentes escenarios:
- GPT-5: Modelo principal, orientado a tareas lógicas y procesos con múltiples pasos. Ideal para resolver problemas complejos que requieren razonamiento estructurado.
- GPT-5-mini: Una versión ligera, diseñada para aplicaciones sensibles al costo. Representa un equilibrio entre rendimiento y eficiencia.
- GPT-5-nano: Optimizado para velocidad, es ideal para sistemas que necesitan baja latencia, como asistentes en tiempo real o aplicaciones embebidas.
- GPT-5-chat Enfocado en conversaciones avanzadas, multimodales y conscientes del contexto, con especial orientación hacia aplicaciones empresariales y asistentes virtuales de alto nivel.
- GPT‑5-Pro: Esta variante no formaba parte de la filtración de GitHub; se trata de una versión mejorada del modelo base que utiliza más recursos computacionales para ofrecer mayor precisión, mejor razonamiento y calidad de respuesta. Está disponible exclusivamente para suscriptores del plan ChatGPT Pro (200 USD/mes).
Disponibilidad
Los suscriptores del plan Plus (20 $ al mes) de ChatGPT tendrán acceso, eso sí, a límites de uso más altos para GPT-5 que los usuarios gratuitos. Por otro lado, las organizaciones que participan en los planes Team, Edu y Enterprise de OpenAI obtendrán acceso a GPT-5 como su modelo predeterminado la próxima semana.
Mejoras de rendimiento
Una de las mejoras más destacadas de GPT‑5 frente a versiones anteriores es su precisión factual. OpenAI ha trabajado intensamente para reducir las alucinaciones, es decir, las ocasiones en que el modelo inventa datos o responde incorrectamente.
Según pruebas internas, GPT‑5 (con razonamiento activado) alucina en solo un 4,8% de los casos, una mejora sustancial frente a tasas anteriores del 20,% en GPT‑4o y hasta 22% en el modelo o3.
Esta mejora se ha hecho especialmente evidente en el ámbito de la salud, un área sensible donde la exactitud es crucial. En el benchmark HealthBench Hard Hallucinations, diseñado para medir errores graves en respuestas sobre temas médicos, GPT‑5 mostró una tasa de alucinación de apenas el 1,6%, muy por debajo de los modelos anteriores (12.9% para GPT‑4o y 15,8% para o3).
Además, GPT‑5 ha demostrado un rendimiento líder en múltiples pruebas de benchmarking, superando a modelos de competencia como Claude Opus (Anthropic), Gemini (Google DeepMind) y Grok (xAI) en varios frentes:
- En SWE-bench Verified, un benchmark con tareas reales de codificación extraídas de GitHub, obtuvo un 74,9% de precisión, superando ligeramente a Claude Opus 4.1 (74,5%) y ampliamente a Gemini 2.5 Pro (59,6%).
- En el exigente GPQA Diamond, que evalúa preguntas científicas de nivel doctoral, GPT‑5 alcanzó un 89.4%, por encima de Claude (80,9%) y Grok 4 Heavy (88,9%).
- Incluso en el test Humanity’s Last Exam, una evaluación transversal en matemáticas, humanidades y ciencias naturales, la versión GPT‑5 Pro logró un 42% de aciertos utilizando herramientas, rozando los resultados de Grok 4 Heavy (44,4%).
Estos resultados consolidan, aparentemente, a GPT‑5 como uno de los modelos más precisos y fiables del mercado.
–
La noticia
OpenAI lanza al fin GPT-5, el modelo de IA más potente del mercado. Promete una reducción drástica de las ‘alucinaciones’
fue publicada originalmente en
Genbeta
por
Marcos Merino
.