2023-09-19
Puntos destacados:
– 🚀 Google anuncia su próximo sistema de inteligencia artificial (IA) llamado Gemini en la conferencia de desarrolladores Google I/O.
– 🤖 Gemini combina las capacidades de lenguaje y multimodalidad de DeepMind para competir con sistemas como ChatGPT de OpenAI.
– 🔍 Gemini tendrá diferentes tamaños y capacidades, y se espera que sea utilizable como asistente personal universal en diversas áreas de la vida cotidiana.
Google ha dado acceso a un pequeño grupo de empresas a una versión temprana de su software de inteligencia artificial conversacional, Gemini.
Gemini tiene como objetivo competir con el modelo GPT-4 de OpenAI. Para Google, el lanzamiento tiene mucho en juego, ya que ha intensificado sus inversiones en IA generativa este año para ponerse al día después del exitoso lanzamiento de ChatGPT de OpenAI respaldado por Microsoft el año pasado.
Esta herramienta es una colección de modelos de lenguaje grandes que alimentan desde chatbots hasta funciones que resumen textos o generan texto original en base a lo que los usuarios desean leer, como borradores de correo electrónico, letras de canciones o noticias. También se espera que ayude a los ingenieros de software a escribir código y generar imágenes originales según lo que los usuarios soliciten. Actualmente, Google está dando acceso a los desarrolladores a una versión relativamente grande de Gemini, pero no a la versión más grande que están desarrollando, que sería más similar a GPT-4. La empresa planea hacer que Gemini esté disponible para las empresas a través de su servicio Google Cloud Vertex AI. Hasta el momento, Google no ha hecho comentarios sobre este informe.
Google anuncia su próximo sistema de IA, Gemini
En la conferencia de desarrolladores Google I/O, el CEO Sundar Pichai anunció el próximo sistema de inteligencia artificial (IA) de la compañía llamado Gemini. Este sistema está siendo desarrollado por la división de DeepMind de Google y podría competir e incluso superar a sistemas de IA como ChatGPT de OpenAI.
Gemini combina las fortalezas del sistema AlphaGo de DeepMind, conocido por dominar el complejo juego de Go, con capacidades extensivas de modelado de lenguaje. Está diseñado para ser multimodal desde cero, integrando texto, imágenes y otros tipos de datos, lo que permite una conversación más natural.
Gemini utilizará herramientas y API de Google, como Pathways, la nueva infraestructura de IA de la compañía, que permitirá el entrenamiento en conjuntos de datos diversos. Esto sugiere que Gemini podría convertirse en el modelo de lenguaje más grande creado hasta ahora.
El CEO de DeepMind, Demis Hassabis, mencionó que Gemini será una serie de modelos disponibles en diferentes tamaños y capacidades. Además, Gemini podría utilizar la memoria, verificar información con fuentes como Google Search y mejorar el aprendizaje por refuerzo para aumentar la precisión y reducir contenido erróneo.
Hasta ahora, los resultados iniciales de Gemini han sido prometedores. Hassabis mencionó que Gemini está en las primeras etapas de exploración de la incorporación de la planificación y la memoria. También se espera que Gemini mejore la consistencia factual al utilizar métodos de recuperación para generar bloques enteros de información en lugar de generación palabra por palabra.
Sundar Pichai reveló que Gemini no es el estado final de los sistemas de IA conversacional, sino un paso hacia chatbots más avanzados. Pichai afirmó que Gemini y futuras iteraciones se convertirán en «increíbles asistentes personales universales» integrados en la vida cotidiana de las personas en áreas como viajes, trabajo y entretenimiento. Además, Pichai aseguró que los chatbots actuales «parecerán triviales» en comparación con Gemini en unos pocos años.
La competencia también ha mostrado interés en el rendimiento de Gemini. El CEO de OpenAI, Elon Musk, cuestionó las cifras reportadas por SemiAnalysis que indicaban que Gemini podría superar a GPT-4.
En cuanto a la disponibilidad de Gemini, Google ha otorgado acceso temprano a un pequeño grupo de desarrolladores externos a la compañía. Esto sugiere que Gemini podría estar listo para una versión beta y su integración en servicios como Google Cloud Vertex AI.
Además de Google, se informa que Meta también está trabajando en un nuevo modelo de lenguaje para competir con OpenAI. Meta recientemente anunció el lanzamiento de Llama 2, un modelo de IA de código abierto, en asociación con Microsoft.
En resumen, Gemini representa un avance significativo en el procesamiento de lenguaje natural. La combinación de la última investigación de IA de DeepMind con los vastos recursos computacionales de Google podría tener un impacto potencialmente transformador en la IA interactiva. Si Gemini cumple con las expectativas, podría impulsar un cambio en la IA integrada de manera responsable en la vida de miles de millones de personas.