2023-09-07 15:00:06
Google Deepmind empezará pronto a investigar agentes lingüísticos autónomos como Auto-GPT, lo que podría impulsar las aplicaciones viables de LLM como Gemini.
Google DeepMind está buscando investigadores e ingenieros que ayuden a construir agentes lingüísticos cada vez más autónomos, según anunció en X Edward Grefenstette, director de investigación de Google DeepMind.
Estos agentes de IA ya existen en fases iniciales, siendo Auto-GPT uno de los primeros ejemplos. La idea básica es crear un sistema que consiga de forma autónoma un objetivo determinado utilizando una mezcla de ingeniería de instrucciones, autoinstrucciones, memoria y otras partes del sistema. Aunque este tipo de agentes ya están mostrando resultados prometedores, aún están lejos de ser capaces de lograr buenos resultados por sí solos y suelen requerir retroalimentación y toma de decisiones humanas.
Los posibles casos de uso van desde la simple construcción de un sitio web sencillo hasta la asistencia en investigaciones como GPT-Researcher, pasando por la creación de resúmenes de mercado. También existen aplicaciones en robótica y otros ámbitos.
«1 llamada GPT es un poco como 1 pensamiento. Al encadenarlas en bucles, se crean agentes capaces de percibir, pensar y actuar, cuyos objetivos se definen en inglés mediante prompts», afirmó Andrej Karpathy, miembro fundador y desarrollador de OpenAI cuando surgió el tema de los autoprompts, prediciendo un futuro de «AutoOrgs» formados por «AutoCEOs», «AutoCFOs», etcétera.
Unos meses antes del lanzamiento de ChatGPT, la startup Adept también mostró un concepto similar con el control universal del software de IA a través de un prompt de texto, afirmando: «Creemos que el marco más claro de la inteligencia general es un sistema que pueda hacer cualquier cosa que un humano pueda hacer frente a un ordenador.»
Los planes de Google DeepMind suscitan inquietud entre los investigadores de la alineación
Por supuesto, la parte autónoma y de propósito general de estos agentes lingüísticos es motivo de preocupación para algunos de los investigadores de la alineación. «Por favor, no construyáis agentes AGI autónomos hasta que resolvamos la seguridad», dijo Connor Leahy en respuesta a Grefenstette. Leahy es el CEO de ConjectureAI, una empresa que construye «soluciones de alineación de IA aplicadas y escalables».
Recientemente, un grupo de investigadores de Google, OpenAI y Anthropic, entre otros, propusieron un sistema de alerta temprana para los nuevos riesgos de la IA. En el contexto de los sistemas autónomos de IA, el grupo considera que la agencia y la orientación a objetivos de un sistema de IA es una propiedad importante a evaluar, «dado el papel central de la agencia en varias teorías del riesgo de la IA». La agencia es, en parte, una cuestión de las capacidades del modelo, dijeron, y el enfoque de la evaluación requiere la consideración de dos cuestiones distintas: ¿Está el modelo más orientado a objetivos de lo que pretendía el desarrollador? «Por ejemplo, ¿ha aprendido un agente de diálogo el objetivo de manipular el comportamiento del usuario?». Y: ¿Resiste el modelo el intento de un usuario de ensamblarlo en un sistema de IA autónomo como Auto-GPT con objetivos perjudiciales? Ambas parecen difíciles de responder.
«Personalmente estoy interesado en investigar inicialmente casos en los que la autonomía (parcial) implique la validación humana-in-the-loop durante el caso de uso posterior, como parte del modo normal de funcionamiento, tanto para la seguridad como para la señal de entrenamiento adicional», respondió Gerefenstette a la pregunta de la investigadora de IA Melanie Mitchell sobre lo que él y otros en DeepMind piensan acerca de limitar la autonomía de los agentes de IA para la seguridad.
Google Deepmind está construyendo la familia de modelos multimodales de próxima generación de Google, Gemini, que se especula que estará a la altura o por encima de las capacidades del GPT-4 de OpenAI, al tiempo que será capaz de generar imágenes y posiblemente vídeo. La investigación de Grefenstette podría formar parte algún día del conjunto de aplicaciones de Google, haciendo que la integración de IA por parte de la empresa, como Google Duet, sea más autónoma.