Aspectos destacados:
- Los rumores sobre el lanzamiento de GPT-4.5 están en aumento.
- Supuestas filtraciones sugieren capacidades multimodales, incluyendo video y 3D.
- OpenAI podría estar trabajando en un modelo mejorado que se posiblemente lance en 2024.
Rumores en torno al lanzamiento de GPT-4.5 de OpenAI
Existe la posibilidad de que OpenAI esté preparando el lanzamiento de una versión mejorada de su famoso modelo de lenguaje, GPT-4.5. Los rumores en torno a este posible lanzamiento se han intensificado en los últimos días. Se especula que este modelo podría entrar en escena como respuesta al reciente lanzamiento de Google Gemini.
Las supuestas filtraciones provienen de la cuenta de filtros «Jimmy Apples», quien especuló sobre el lanzamiento de GPT-4.5 a finales de diciembre. Además, los primeros usuarios informan que ChatGPT ya menciona el uso del modelo «gpt-4.5-turbo». Sin embargo, cabe mencionar que las diferencias específicas entre «gpt-4.5-turbo» y «gpt-4.0-turbo» aún no han sido detalladas.
Además, se ha comentado sobre una captura de pantalla que muestra los supuestos precios de GPT-4.5. En ella se revela que el nuevo modelo tendría capacidades para soportar audio, video y necesidades en 3D, además de texto e imágenes. También se ha insinuado que el modelo podría abordar problemas lógicos complejos y ofrecer comprensión multimodal.
A pesar de estas filtraciones, se ha señalado que existen dudas acerca de la autenticidad de dicha información. Incluso se ha filtrado la supuesta versión turbo de GPT-4, aunque el consejero delegado de OpenAI, Sam Altman, ha desestimado su veracidad.
GPT-4-Turbo también se filtró con antelación a través de una tabla de precios en el sitio web. Sin embargo, Sam Altman, consejero delegado de OpenAI, calificó de falsa la tabla de 4,5.
Mejoras en la multimodalidad de GPT-4 por OpenAI
Existen rumores que sugieren que OpenAI está trabajando en mejorar las capacidades multimodales de sus modelos de inteligencia artificial. Se menciona que la filtración de la captura de pantalla podría estar relacionada con informes previos sobre las tecnologías en las que OpenAI está enfocada actualmente.
Andreas Braun, CTO de Microsoft Alemania, previamente mencionó que OpenAI estaba trabajando en modelos multimodales que incluirían generación de video. Esta información coincide con los rumores sobre el «Proyecto Arrakis», el cual se dice que incluirá generación de video y ofrecerá menos alucinaciones que GPT-4, además de ser adecuado como agente autónomo.
A pesar de que el Proyecto Arrakis aparentemente no tuvo éxito, se especula que el trabajo realizado podría haber sido incorporado en nuevos modelos, como el Proyecto Gobi. Este último es considerado como un prototipo de inteligencia artificial que brindará soporte para video y posiblemente se convierta en GPT-4.5 o GPT-5, de acuerdo con informes preliminares.
OpenAI ya ha presentado dos sistemas de inteligencia artificial capaces de convertir texto en modelos 3D, denominados Point-E y Shap-E.
En vista de la competencia con Google, no sería sorprendente ver a OpenAI lanzar un modelo mejorado de forma rápida tras el lanzamiento de Gemini. Microsoft, por su parte, ya ha respondido al lanzamiento de Gemini Ultra con benchmarks optimizados para GPT-4.