De Operator a Agent. A principios de año presentó Operator, una herramienta que permitía a ChatGPT interactuar con páginas web. Luego llegó Deep Research, enfocada en redactar informes largos a partir de múltiples fuentes. La idea de fondo estaba clara: ir más allá de la conversación y acercarse a tareas reales. Lo que se ha presentado hoy es algo así como una herramienta que unifica todos estos avances anteriores.
Durante la demostración, los responsables del proyecto plantearon una situación cotidiana: organizar un viaje para asistir a una boda. El agente fue capaz de entender el contexto, buscar hoteles, proponer regalos, tener en cuenta el clima, el código de vestimenta e incluso recordar que había que comprar un traje. Lo hizo analizando el mensaje, accediendo a la web y actuando paso a paso, como lo haría una persona. La diferencia es que todo ocurrió dentro de ChatGPT, sin necesidad de alternar pestañas ni dar instrucciones una a una.
Un ordenador virtual para la IA. La clave está en que el agente no se limita a responder texto: opera dentro de una especie de ordenador virtual al que OpenAI le ha dado acceso. Puede usar un navegador de texto para leer páginas rápidamente, un navegador visual para interactuar con botones y formularios, e incluso un terminal para ejecutar comandos, generar código y manipular archivos. También puede trabajar con hojas de cálculo, presentaciones, y acceder a servicios como Google Drive, Calendar o GitHub si el usuario lo autoriza.