En esta publicación te cuento todo lo que se sabe de OpenAI Operator. Primero, te explico de forma sencilla qué es, cómo funciona y qué requisitos debes cumplir para probarlo. Luego, te planteo algunas reflexiones sobre si este será realmente el futuro de la informática. Finalmente, te invito a participar en el debate dejando un comentario, ya sea para aportar nuevas ideas o para corregir algo de lo que mencioné. ¡Manos a la obra!
Índice de contenidos
OpenAI Operator es un sistema basado en inteligencia artificial capaz de interactuar con interfaces humanas. Esta función, que está integrada dentro de ChatGPT, entraría dentro de la categoría de agentes de IA. En pocas palabras, estas agentes son sistemas diseñados para percibir el entorno, procesar la información y tomar decisiones en base a los datos que han recibido.
La idea es que los agentes sean especialistas en algún campo. En este caso, OpenAI Operator es capaz de navegar por la red e interactuar con interfaces que fueron diseñadas para humanos. De este modo, en vez de ser nosotros los que buscamos un apartado dentro de una web, compramos un producto o escribimos un correo, sea la IA la que se encargue de todo.
Actualmente, Operator es una función experimental que no soluciona ningún problema específico. De hecho, si echas un vistazo a la presentación que te adjunto justo encima de estas líneas, verás que su funcionamiento es bastante lento y torpe, en líneas generales. Teniendo esto en cuenta, es evidente que no saldría a cuenta delegar tareas ahora mismo en Operator, pues es más rápido hacerlas por nuestra cuenta. Sin embargo, esto podría ser el principio de un cambio de paradigma en la interacción del ser humano con las máquinas.
Tanto en la presentación que llevó a cabo OpenAI como en la web oficial de Operator se mencionan ejemplos concretos, que van desde completar formularios y realizar pedidos en una web hasta tareas más personalizadas como la creación de memes. La compañía hace hincapié en el hecho de que esta herramienta ha sido pensada para automatizar tareas repetitivas, tanto para usuarios particulares como para empresas.
Además de esto, OpenAI ha hecho buenas migas con algunas marcas y administraciones con el fin de integrar Operator en servicios existentes. Entre algunas de las que se mencionaron en la presentación están DoorDash, Instacart e incluso entidades públicas como la Ciudad de Stockton.
El funcionamiento de OpenAI Operator se basa en el innovador modelo Computer-Using Agent (CUA), que integra las capacidades de visión de GPT-4 con algoritmos de razonamiento avanzado basados en aprendizaje por refuerzo. Esto le permite analizar el entorno visual de una página mediante capturas de pantalla, identificando elementos gráficos como botones, menús y campos de texto.
Cuando se le asigna una tarea, Operator interpreta la instrucción en lenguaje natural y traduce esa solicitud en una serie de acciones concretas. Por ejemplo, si se le indica que complete un formulario o realice una compra en línea, el agente simula el comportamiento humano: desplaza la página, hace clic en los botones necesarios, introduce datos en los campos correspondientes y navega entre diferentes secciones de la web. Esta capacidad de interactuar con la interfaz gráfica sin depender de API específicas lo hace especialmente versátil y adaptable a diferentes sitios y aplicaciones.
Además, Operator está diseñado para ceder el control al usuario cuando es necesario. En situaciones que requieran mayor seguridad, como el ingreso de credenciales, la verificación de identidad o la gestión de datos sensibles, OpenAI Operator solicita la intervención del usuario. De esta manera, se asegura que las tareas críticas se manejen con la supervisión humana, garantizando una experiencia segura y confiable.
Otra característica fundamental es su capacidad de autocorrección. Si Operator detecta que una acción no se ha realizado correctamente o encuentra obstáculos inesperados en la interfaz, utiliza sus algoritmos de razonamiento para ajustar el proceso y corregir la ejecución en tiempo real. A grandes rasgos, este es el funcionamiento de OpenAI Operator.
Como ya es habitual, muchas de las cosas que presenta OpenAI parecen sacadas de una película de ciencia ficción. Y Operator no es una excepción. Sin embargo, personalmente tengo serias dudas de que este sea el futuro de la interacción con las máquinas. Es posible que un Operator refinado (no la versión actual, que todavía debe mejorar) sea útil en algunos casos concretos, especialmente en el mundo empresarial.
No obstante, no tengo tan claro que cambie la forma en la que interactuamos con el PC o el móvil. Aquí tienes mis razones para pensar así:
Y tú, ¿qué opinas de OpenAI Operator? ¿Crees que es una vía que se debería explorar? Déjame tu comentario más abajo. ¡Nos leemos!
Se han anunciado el chip Snapdragon 6 Gen 4, que está utilizando unos núcleos de…
Seagate está lanzando su nueva serie de unidades de estado sólido Ultra-Compact SSD, que se…
En Profesional Review ya hemos podido probar varios PC ARM, algunos de ellos de la…