2023-11-06 09:01:59
Con «Grok», Elon Musk presenta un chatbot construido con datos de «X» para usuarios premium de «X». A diferencia de OpenAI con ChatGPT, Musk da al chatbot más libertad creativa en sus respuestas.
Musk y su empresa describen Grok como un chatbot humorístico, ingenioso y rebelde que puede responder a casi cualquier pregunta. Grok utiliza su modelo de conocimiento basado en datos de Internet y X, así como información en tiempo real de X, para dar respuestas. Según xAI, el chatbot también responde a «preguntas picantes» que serían rechazadas por la mayoría de los demás sistemas de IA.
En la actualidad, Grok es un chatbot sólo de texto. No ofrece capacidades multimodales como el reconocimiento de voz o de imágenes, pero están en proyecto. xAI subraya que Grok es todavía un «producto beta muy temprano».
Su peculiar nombre está inspirado en la historia de ciencia ficción «La guía del autoestopista galáctico». Representa, entre otras cosas, la empatía y la comunicación amistosa.
Grok-1 se construyó en sólo cuatro meses
Grok se basa en el gran modelo de lenguaje Grok-1, que se construyó en los últimos cuatro meses utilizando una pila de entrenamiento e inferencia desarrollada por xAI, basada en Kubernetes, Rust y JA, con el objetivo de maximizar la potencia de cálculo utilizable por vatio. Se tardó dos meses en entrenar el modelo.
Según xAI, el primer prototipo, Grok-0, con 33 mil millones de parámetros, logró un rendimiento cercano a LLaMA 2 (70B) en los puntos de referencia estándar del modelo de lenguaje. Sin embargo, en comparación con el LLM de código abierto de Meta, necesitó la mitad de recursos de entrenamiento, afirma la empresa.
La longitud del contexto es de 8.192 tokens, y los datos de entrenamiento en Internet y los datos de feedback humano finalizan en el tercer trimestre de 2023.
Según xAI, en los dos últimos meses se han introducido «mejoras significativas» en las áreas de lógica y programación, lo que ha permitido mejorar el rendimiento de Grok-1 en las pruebas correspondientes.
En los benchmarks publicados, Grok-1 está claramente por detrás de GPT-4, pero rinde mejor que GPT-3.5 y alcanza el nivel de Anthropics Claude 2 en el benchmark de comprensión de lenguaje MMLU con cinco ejemplos («5-shot»).
Imagen: xAIIEn la prueba de referencia un tanto inusual Finales nacionales húngaras de bachillerato en matemáticasGrok-1 quedó en segundo lugar, muy por delante de GPT-3.5 y relativamente cerca de GPT-4. xAI justifica la elección de la prueba de referencia por el hecho de que se publicó a finales de mayo y, por tanto, se garantiza que no se incluyó en los datos de entrenamiento del modelo. xAI cree que su modelo lingüístico es superior a otros modelos de su clase.
En la Tarjeta modelo Grok-1, xAI señala que el modelo de lenguaje, como todos los demás, puede inventar («alucinar») información. Así que todavía no es TruthGPT.
Exclusivo para clientes X de pago
Toby Pholen, miembro fundador de xAI, da una idea de la interfaz de usuario de Grok en X. El programa puede manejar múltiples consultas simultáneamente, y se puede alternar entre las respuestas en una interfaz de árbol. Las generaciones de código pueden abrirse directamente en un editor de código VS, y las respuestas de texto pueden guardarse en un editor markdown para su uso posterior.
Vídeo: Toby Pholen vía xAI
xAI ofrece acceso anticipado al prototipo Grok a un número limitado de usuarios Premium Plus en EE.UU. con el fin de recabar comentarios para mejorar la funcionalidad antes de un lanzamiento más amplio. La suscripción Premium Plus cuesta 16 dólares al mes.
Los clientes Premium de EE.UU. interesados pueden inscribirse en la lista de espera de Grok. La empresa tiene previsto introducir nuevas funciones y capacidades en los próximos meses.
La investigación y el desarrollo de xAI se centran en áreas adicionales como el control escalable y asistido por herramientas, la integración con la verificación formal para la seguridad, la comprensión y recuperación de contextos largos, la defensa robusta contra ataques y las capacidades multimodales.
Según Musk, xAI se centra en cuestiones científicas profundas como la materia oscura, la gravedad y la paradoja de Fermi, entre otras, y pretende comprender «la verdadera naturaleza del universo». La empresa ha reunido a un equipo de expertos de las principales instituciones de investigación en IA, como OpenAI, Google Research, Microsoft Research y DeepMind.
Musk y su equipo creen que la IA superinteligente es una posibilidad realista para 2029 y ayudará a la sociedad a entender «qué demonios está pasando realmente.» Además de su enfoque científico, xAI también competirá con OpenAI y proporcionará ofertas para consumidores y empresas.