2024-05-14 18:45:36
Google I/O 2024 estuvo repleto de anuncios de IA, desde nuevos modelos de lenguaje como Gemini 1.5 Pro y Gemini Flash, hasta chatbots personalizados, IA para imágenes y video, y chips de IA más rápidos. Este resumen analiza las principales noticias de IA de Google I/O.
Google I/O, la conferencia anual de desarrolladores de Google, se ha convertido en el evento más importante del año para la inteligencia artificial. Este año no fue diferente, con una gran cantidad de anuncios relacionados con IA que abarcan desde nuevos modelos de lenguaje hasta chatbots personalizados, IA para imágenes y video, y chips de IA más rápidos.
Nuevos modelos de lenguaje: Gemini 1.5 Pro y Gemini Flash
El CEO de Google, Sundar Pichai, anunció que Gemini 1.5 Pro aumentará su ventana de contexto de uno a dos millones de tokens. Esto significa que el modelo ahora puede procesar más información y generar respuestas más completas y matizadas. El modelo también está disponible a través de API para todos los desarrolladores interesados.
Google también introdujo un nuevo modelo llamado Gemini Flash. Este modelo está optimizado para velocidad y eficiencia, y es adecuado para resúmenes, aplicaciones de chat, subtítulos de imagen y video, y extracción de datos de documentos largos. Según Demis Hassabis, CEO de Google DeepMind, Gemini Flash es más ligero y menos costoso que Gemini Pro, pero igual de potente. Esto se logró a través de la «destilación», que transfiere las funciones principales de Pro al modelo más pequeño.
Nuevas funciones para Gemini en Google Workspace
Google anunció nuevas funciones para Gemini en Google Workspace. La barra lateral de Workspace ahora utiliza Gemini 1.5 Pro para respuestas más detalladas. La aplicación de Gmail está recibiendo funciones como resúmenes de correos electrónicos, sugerencias de respuestas contextuales y Gmail Q&A. La función «Ayuda para escribir» ahora es compatible en Gmail y Docs para español y portugués en escritorio.
Otra nueva función es la capacidad de crear un compañero de equipo virtual con su propia cuenta de Workspace. Este compañero de equipo se puede configurar para tareas específicas, como monitorear y rastrear proyectos, organizar información, proporcionar contexto, identificar tendencias a partir de análisis de datos y colaborar con el equipo.
Gemini Live y chatbots personalizados «Gems»
Nuevas formas de interactuar con Gemini incluyen chat en Mensajes de Google y una experiencia de conversación móvil llamada Live con tecnología de voz natural. Los suscriptores avanzados de Gemini pronto podrán crear versiones personalizadas de Gemini llamadas Gems que pueden actuar como entrenadores de fitness, compañeros de codificación o entrenadores de escritura.
Google SGE continúa desplegándose
Los resúmenes generados por Gemini, ahora llamados «Descripciones de IA», estarán disponibles para todos los usuarios de EE. UU. en Búsqueda de Google esta semana. Los usuarios también pronto podrán buscar videos. Otros países seguirán pronto.
Proyecto Astra
Astra es la visión de Google de un asistente de IA multimodal para la vida cotidiana. Puede procesar texto, video y audio en tiempo real. En un video, Google mostró a Astra identificando oradores, crayones y otros objetos en respuesta a una imagen de cámara y comandos de voz.
IA para imágenes, video y música: Imagen 3, Veo, Music AI
Google también presentó sus últimos modelos de IA para crear contenido multimedia: Veo, para crear videos en 1080p, e Imagen 3, para generar imágenes a partir de descripciones de texto.
Chatbot fotográfico basado en IA
Google anuncia Ask Photos con Gemini, un chatbot de inteligencia artificial para la aplicación Google Photos. La función estará disponible para los suscriptores de Google One en los EE. UU. en los próximos meses.
Axion y Tensor
Google también presentó el chip Trillium (TPU v6) para centros de datos de IA, que es casi cinco veces más rápido que la versión anterior. Según el CEO Sundar Pichai, la demanda de chips de IA ha aumentado en un factor de 1 millón en los últimos seis años.
Más IA para Android
Google está integrando su tecnología de IA directamente en el sistema operativo Android.
Más IA para Android
Google está integrando su tecnología de IA directamente en el sistema operativo Android. Con Circle to Search, los estudiantes ahora pueden usar gestos para buscar ayuda con la tarea para obtener instrucciones paso a paso para problemas de física y matemáticas.
El asistente de Gemini incorporado en Android está diseñado para comprender mejor el contexto y pronto se usará en más aplicaciones, como insertar imágenes generadas en mensajes o encontrar información en videos de YouTube y PDFs.
Las imágenes generadas por Gemini se pueden arrastrar y soltar en aplicaciones como Gmail o Mensajes de Google. Para videos de YouTube, la función «Preguntar a este video» puede buscar información específica en un video. Los usuarios avanzados de Gemini pueden usar Preguntar a este PDF para encontrar rápidamente respuestas en documentos PDF sin tener que hojear páginas.
Gemini Nano con multimodalidad estará disponible en dispositivos Pixel más adelante este año. Este modelo en dispositivo entenderá imágenes, sonido y habla además de texto. En Talkback, proporcionará descripciones más claras de imágenes y advertirá sobre estafas telefónicas. Más capacidades de IA para Android están en camino. Los desarrolladores ahora pueden trabajar con Gemini Nano y Gemini en Android Studio.
Conclusión
Google I/O 2024 fue un evento repleto de anuncios de IA que muestran el compromiso de la compañía con esta tecnología. Los nuevos modelos de lenguaje, las funciones de Workspace, los chatbots personalizados, la IA para imágenes y video, los chips de IA
.