¿Está probando OpenAI el GPT-4.5? El chatbot gpt2 escribe mejor código que el GPT-4 y Claude

Añadir a tus IAs favoritasQuitar de tus favoritasQuitar de favoritos 0
Puntuación+3

2024-05-01 15:40:30

Un nuevo modelo de IA llamado «gpt2-chatbot» muestra capacidades que parecen estar al nivel o incluso por encima del nivel de GPT-4. Analizamos su rendimiento y exploramos las posibilidades de que sea una prueba secreta de OpenAI.

En el mundo de la inteligencia artificial, un nuevo modelo ha aparecido en escena, desafiando las capacidades del famoso GPT-4 de OpenAI. Este chatbot, llamado «gpt2-chatbot», ha estado demostrando un rendimiento sorprendente en diversas tareas, desde resolver problemas de olimpiadas matemáticas hasta generar código de alta calidad.

¿Qué sabemos sobre gpt2-chatbot?

El modelo «gpt2-chatbot» surgió sin mucha fanfarria en la Arena de Chatbot de LMSYS Org, un sitio web que compara modelos de lenguaje de IA. Sin embargo, su rendimiento rápidamente llamó la atención de investigadores y expertos en inteligencia artificial.

Andrew Gao, un investigador de IA en la Universidad de Stanford, afirma estar «de acuerdo con las evaluaciones de que está al menos al nivel de GPT-4». Este modelo ha demostrado habilidades impresionantes en tareas complejas de razonamiento y codificación.

Habilidades IA sobresalientes
  1. Resolución de problemas matemáticos: gpt2-chatbot resolvió un problema de la prestigiosa Olimpiada Internacional de Matemáticas en el primer intento, un logro que Gao califica como «extremadamente difícil».
  2. Codificación avanzada: Según Ethan Mollick, profesor en la Escuela Wharton, el modelo parece desempeñarse mejor que GPT-4 Turbo en tareas de razonamiento complejas como escribir código. Chase McCoy, ingeniero fundador en CodeGen, confirmó que gpt2-chatbot «definitivamente es mejor en tareas de manipulación de código complejas que Claude Opus o el último GPT4».
  3. Generación de contenido creativo: Usuarios en Twitter han demostrado la capacidad del modelo para generar juegos completos, como un juego de Serpiente, y dibujar figuras como un unicornio, superando pruebas propuestas en el controvertido artículo «Sparks of AGI» de Microsoft.

¿Está OpenAI probando un nuevo modelo?

Dadas las similitudes con creaciones anteriores de OpenAI y las pistas sobre el tokenizador utilizado, algunos expertos sugieren que gpt2-chatbot podría estar relacionado con la compañía y ser una versión de prueba de GPT-4.5 u otro nuevo modelo.

Sin embargo, las auto-descripciones de los modelos de IA no siempre son fiables, y algunos probadores reportan más alucinaciones que GPT-4 Turbo. El CEO de OpenAI, Sam Altman, respondió a los rumores con una publicación críptica en X (anteriormente Twitter): «Tengo un punto débil por gpt2».

Aunque las similitudes con creaciones anteriores de OpenAI sugieren una posible conexión, aún faltan pruebas concluyentes. Es posible que un grupo menos conocido haya lanzado el modelo para demostrar sus capacidades y atraer la atención de la comunidad de IA.

Conclusión

Independientemente de su origen, gpt2-chatbot ha desatado un frenesí de especulaciones y entusiasmo en la comunidad de inteligencia artificial. Su rendimiento sobresaliente plantea preguntas emocionantes sobre los límites de la IA y el potencial de nuevos modelos aún más potentes. A medida que se desarrollen más detalles, la comunidad tecnológica estará observando de cerca este emocionante avance.

Deja una opinión

      Deje una respuesta

      🤖 AI MAFIA
      Logo