Google lanza Imagen 2 con generación de texto y logotipo

Añadir a tus IAs favoritasQuitar de tus favoritasQuitar de favoritos 0
Puntuación0

2023-12-17 07:42:45

Puntos destacados:

👁️ Google está ampliando la disponibilidad de Imagen 2, su modelo de inteligencia artificial que puede crear y editar imágenes.
🖼️ La compañía no revela la fuente de los datos utilizados para entrenar el nuevo modelo ni proporciona una forma para que los creadores se opten por salir o recibir compensación.
🌐 Imagen 2 ofrece mejoras significativas en la calidad de imagen y la capacidad de renderizar texto y logos.

Google está ampliando la disponibilidad de la segunda generación de Imagen, su modelo de inteligencia artificial que puede crear y editar imágenes, al menos para los clientes de Google Cloud que utilizan Vertex AI y han sido aprobados para acceder a ella.

Sin embargo, la compañía no revela qué datos utilizó para entrenar el nuevo modelo, ni ofrece una forma para que los creadores que pudieron contribuir inadvertidamente al conjunto de datos opten por salir o soliciten compensación.

Llamada Imagen 2, el modelo mejorado de Google, que fue lanzado silenciosamente en vista previa en la conferencia I/O de la empresa en mayo, fue desarrollado utilizando tecnología de Google DeepMind, el laboratorio insignia de inteligencia artificial de Google. En comparación con Imagen de primera generación, Google afirma que ha mejorado «significativamente» en cuanto a calidad de imagen, e introduce nuevas capacidades, como la capacidad de renderizar texto y logotipos.

Gracias a «nuevas técnicas de entrenamiento y modelado», Imagen 2 también puede comprender descripciones más detalladas y proporcionar «respuestas detalladas» a preguntas sobre elementos en una imagen. Estas técnicas también mejoran la comprensión multilingüe de Imagen 2, permitiendo al modelo traducir una descripción en un idioma a una salida (por ejemplo, un logotipo) en otro idioma.

Imagen 2 aprovecha SynthID, un enfoque desarrollado por DeepMind, para aplicar marcas de agua invisibles a las imágenes creadas por él. Por supuesto, detectar estas marcas de agua, que Google afirma que son resistentes a ediciones de imagen, incluyendo compresión, filtros y ajustes de color, requiere una herramienta proporcionada por Google que no está disponible para terceros.

La regurgitación, o cuando un modelo generativo devuelve una copia exacta de un ejemplo de entrenamiento, es una preocupación legítima para los clientes corporativos y los desarrolladores. Un estudio académico mostró que Imagen de primera generación no era inmune a este fenómeno, devolviendo fotos identificables de personas reales, trabajos con derechos de autor de artistas y más cuando se le pedía de ciertas maneras.

Deja una opinión

      Deje una respuesta

      🤖 AI MAFIA
      Logo