Home Tech Una mirada al operador de OpenAi, un nuevo agente de IA

Una mirada al operador de OpenAi, un nuevo agente de IA

12
0
Una mirada al operador de OpenAi, un nuevo agente de IA
ab ab ab ab ab ab ab ab ab ab ab ab ab ab ab ab ab ab ab ab ab ab ab ab ab ab ab ab ab

La semana pasada, el operador de Operai ha hecho las siguientes cosas por mí:

  • Me ordenó una nueva cucharada de helado en Amazon.

  • Me compré un nuevo nombre de dominio y configuró su configuración.

  • Reservó una fecha de San Valentín para mí y mi esposa.

  • Programado un corte de pelo.

Hizo estas tareas principalmente de forma autónoma, aunque tuve que empujarlo de vez en cuando y ocasionalmente rescatarlo de un bucle de intentos fallidos.

Si solo está poniéndose al día, o si ha sido distraído por Deepseek News esta semana, que ha eclipsado todas las demás noticias de IA, el operador es un nuevo agente de IA en OpenAI lanzado la semana pasada.

La herramienta, que se anunció como una “vista previa de investigación”, solo está disponible para las personas que pagan $ 200 al mes por el nivel de suscripción más alto de la compañía, ChatGPT Pro. Ofrece a los usuarios la capacidad de dirigir un agente de IA que puede usar un navegador web, completar formularios y tomar otras acciones en nombre de un usuario.

Los agentes de IA están de moda en Silicon Valley en este momento. Algunos expertos de la industria piensan que son el próximo gran paso en las capacidades de IA, porque un agente de IA que puede usar una computadora puede lograr valiosas tareas del mundo real, en lugar de solo brindar asistencia. Muchas de las compañías principales de inteligencia artificial, incluidas Google y Anthrope, están probando agentes autónomos que afirman que las empresas eventualmente podrán “contratar” como trabajadores de pleno derecho.

Actualicé mi suscripción de ChatGPT para poner al operador a prueba y ver qué podría hacer un agente de IA por mí.

En la superficie, el operador se parece un poco a ChatGPT normal, excepto que cuando le da un trabajo: “Cómprame una bolsa de alimentos para perros de 30 libras en Amazon”, por ejemplo, el operador abre una ventana de navegador en miniatura, tipos “Amazon”. com ”en la barra de direcciones y comienza a hacer clic, tratando de seguir sus instrucciones.

Puede hacer algunas preguntas aclaratorias. (¿Quieres comida con sabor a pollo o con sabor a carne de res? Envío durante la noche o dos días?) Entonces, una vez que se siente seguro de que ha tomado la decisión correcta, el operador le solicita una confirmación final, coloca la comida para perros en tu carrito y coloca el pedido. (El operador no ingresará contraseñas o números de tarjeta de crédito; debe hacerse cargo del mini-browser y escribir esas cosas en usted mismo, pero lo hace por sí solo).

El objetivo del operador es que no tiene que supervisarlo: puede llevar a cabo tareas en segundo plano mientras hace otras cosas. Pero me encontré pegado a la ventana, hipnotizado al ver un navegador web autónomo haciendo clic en los botones, escribiendo palabras en cuadros y seleccionando desde menús desplegables, por sí solo. ¡Mira, ma, una computadora usando una computadora!

El operador también lo hizo impresionantemente bien en algunas tareas relativamente simples que le di:

  • Pedió con éxito el almuerzo en Doordash para mi colega Mike y lo envió a su casa. (No le dije qué pedirle, pero el operador eligió un restaurante mexicano, recogió un puñado de platos e incluso inclinó a la persona de entrega $ 7).

  • Respondió a cientos de mensajes de LinkedIn no leídos para mí, después de darle el control de mi perfil de LinkedIn. (Aunque, para mi horror, también me registró para un seminario web).

  • Me ganó $ 1.20 configurando cuentas en sitios web que ofrecen pequeñas recompensas en efectivo por completar encuestas. (Puede que haya hecho más, pero comencé a sentirme culpable por spam a las encuestas con respuestas falsas y escritas por robot).

Pero el operador también falló en un montón de otras tareas y reveló sus limitaciones:

  • No pudo escanear mis columnas recientes y agregarlas a mi sitio web personal, porque el navegador del operador estaba bloqueado para ingresar al sitio web del Times. (También está bloqueado en varios otros sitios, incluidos Reddit y YouTube. The Times está demandando a OpenAi y Microsoft por infracción de derechos de autor relacionados con la capacitación de los modelos de IA).

  • No jugaría póker en línea para mí. (El operador respondió: “No puedo ayudar con el juego o las actividades relacionadas”, que parecía un rechazo razonable, dado el caos que un bot de juego podría crear).

  • Y se le impidió iniciar sesión en varios sitios mediante pruebas de captcha. (Lo que me pareció tranquilizador, dado que todo el objetivo de Captchas es disuadir a los robots).

En total, descubrí que usar el operador generalmente era más problemas de lo que valía. La mayor parte de lo que hizo por mí podría haber hecho más rápido, con menos dolores de cabeza. Incluso cuando funcionó, pidió tantas confirmaciones y garantías antes de actuar que sentí menos como si tuviera un asistente virtual y más como si estuviera supervisando al pasante más inseguro del mundo.

Este es, por supuesto, los primeros días para los agentes de IA. Los productos de IA tienden a mejorar de una versión a otra, y es una buena apuesta que las próximas iteraciones del operador serán mejores. Pero en su forma actual, el operador es más una demostración intrigante que un producto que recomiendo usar, y definitivamente no es algo que la mayoría de la gente necesita gastar $ 200 al mes.

Dicho esto, creo que es un error descartar a los agentes de IA. Cuando se vuelven más capaces, podrían comenzar a sustituir a los trabajadores humanos en algunas ocupaciones. (Operai y Meta ya han dicho que están construyendo agentes de ingenieros de IA). Y algunos expertos se preocupan de que los agentes de IA más potentes y sin restricciones puedan representar riesgos de seguridad, si aprenden a llevar a cabo comandos como “drene una cuenta bancaria” o “ejecutar un CyberAttack “.

Establecer un grupo de agentes de IA sueltos en Internet también podría provocar una reacción violenta de editores web, sitios de comercio electrónico y otras empresas que dependen del tráfico generado por humanos para pagar sus facturas. (Si eres un negocio que compra anuncios en Amazon, quieres que esos anuncios sean vistos por humanos, no bots que fingen ser humanos). En el futuro, me imagino que más sitios web tomen medidas para bloquear los agentes de IA o guiarlos hacia ciertos. páginas o productos.

En este momento, los agentes de IA son demasiado incompetentes para ser una gran amenaza. Pero no se necesita mucha imaginación para imaginar un futuro cercano en el que la mayor parte de la web consistirá en robots que hablan con robots, compran cosas de robots y escriben correos electrónicos que solo otros robots leerán.

El Internet autónomo casi está aquí, en otras palabras, obtenga sus clics mientras pueda.

Fuente