Llevamos mucho tiempo hablando de agentes de inteligencia artificial, pero OpenAI acaba de convertir esa conversación en algo mucho más tangible. La compañía ha presentado ChatGPT Agent, una función que convierte su popular chatbot en algo más autónomo: ahora es capaz de ejecutar tareas complejas usando un ordenador virtual, con herramientas que le permiten navegar, programar o incluso tomar decisiones.
De Operator a Agent. A principios de año presentó Operator, una herramienta que permitía a ChatGPT interactuar con páginas web. Luego llegó Deep Research, enfocada en elaborar informes largos a partir de múltiples fuentes. La idea de fondo estaba clara: ir más allá de la conversación y acercarse a tareas reales. Lo que se ha presentado hoy es algo así como una herramienta que unifica todos estos avances anteriores.
Durante la demostración, los responsables del proyecto plantearon una situación cotidiana: organizar la asistencia a una boda. El agente fue capaz de entender el contexto, buscar hoteles, proponer regalos, tener en cuenta el clima, el código de vestimenta e incluso recordar que había que comprar un traje. Lo hizo analizando el mensaje, accediendo a la web y actuando paso a paso, como lo haría una persona. La diferencia es que todo ocurrió dentro de ChatGPT, sin necesidad de alternar pestañas ni dar instrucciones una a una.
Algunas de las tareas que ya puede controlar el agente:
- Crear presentaciones y hojas de cálculo a partir de datos reales.
- Planificar cenas completas y generar la lista de la compra con envío incluido.
- Buscar productos online, añadirlos al carrito y comprarlos.
- Reservar restaurantes o servicios según presupuesto, ubicación y tipo de evento.
- Organizar viajes con múltiples condiciones: fechas, número de personas, actividades y coste por individuo.
Un ordenador virtual para la IA. La clave está en que el agente no se limita a responder texto: opera dentro de una especie de ordenador virtual al que OpenAI le ha dado acceso. Puede usar un navegador de texto para leer páginas rápidamente, un navegador visual para interactuar con botones y formularios, e incluso un terminal para ejecutar comandos, generar código y manipular archivos. También puede trabajar con hojas de cálculo, presentaciones, y acceder a servicios como Google Drive, Calendar o GitHub si el usuario lo autoriza.
¿Qué hay bajo el capó? El modelo que impulsa ChatGPT Agent (desarrollado específicamente para esta función, aunque sin nombre oficial) fue entrenado con tareas complejas que requerían combinar múltiples herramientas. OpenAI utilizó aprendizaje por refuerzo, el mismo enfoque que ya emplea en sus modelos de razonamiento, para enseñarle a elegir cuándo usar el navegador, el terminal o una API. La idea fue desarrollar una solución capaz de decidir con precisión cómo actuar en función de cada objetivo.
Cómo se activa y quién puede usar ChatGPT Agent. El modo agente ya está disponible para los usuarios de los planes Pro, Plus y Team de ChatGPT. Se activa desde el menú de herramientas o escribiendo directamente /agent en el cuadro de texto. Más adelante llegará también a los planes Enterprise y Education. En el caso del Viejo Continente, OpenAI no ha confirmado ninguna fecha para su despliegue en el Espacio Económico Europeo, una región donde la presión regulatoria ya ha ralentizado otros lanzamientos de la compañía.
No es solo OpenAI. La llegada de ChatGPT Agent se enmarca en una carrera mucho más amplia. Anthropic ya presentó Computer Use, una función que permite a Claude utilizar un ordenador virtual para ejecutar tareas de forma autónoma. Perplexity, por su parte, ha lanzado Comet, un navegador experimental que apuesta por la continuidad del pensamiento: un entorno donde el sistema no solo busca, sino que recuerda, conecta y actúa con cada nuevo paso.
Todas estas propuestas dependen cada vez menos de la lógica de las pestañas, los clics y los formularios. Las interfaces conversacionales empiezan a dar paso a agentes que entienden lo que queremos hacer… y quieren hacerlo por nosotros. La inteligencia artificial ya no es solo un asistente: es una nueva forma de interactuar con la tecnología. Y lo estamos viendo desplegarse en tiempo real. Con errores, sí, y con mucho margen todavía para evolucionar.
Imágenes | OpenAI
–
La noticia
Creíamos que ChatGPT era solo un chatbot muy capaz. OpenAI acaba de convertirlo en algo muy distinto: un agente de verdad
fue publicada originalmente en
Xataka
por
Javier Marquez
.