2023-09-21 19:15:04
El nuevo sistema de conversión de texto en imagen DALL-E 3 de OpenAI ofrece mejoras significativas respecto a su predecesor y se integra de forma nativa con ChatGPT. Según OpenAI, esta integración debería eliminar la necesidad de «ingeniería rápida».
Según OpenAI, DALL-E 3 muestra avances significativos en su capacidad para generar imágenes que siguen con precisión instrucciones complicadas. Esto incluye la representación precisa de una escena con objetos específicos, sus relaciones entre sí y detalles como manos humanas o texto en la imagen, puntos débiles típicos de anteriores sistemas de conversión de texto en imagen.
DALL-E 3, al igual que DALL-E 2 y otros sistemas de texto a imagen, admite una gran variedad de estilos, desde abstractos artísticos a dibujos de cómic o fotorrealismo. La idea para la imagen de este artículo era: «Una ilustración de un aguacate sentado en la silla de un terapeuta, diciendo: ‘Me siento tan vacío por dentro’, con un agujero del tamaño de un hueso en el centro. El terapeuta, una cuchara, garabatea notas».
DALL-E 3 será una aplicación ChatGPT
Otra novedad es que DALL-E 3 se convertirá en una aplicación ChatGPT para los usuarios de ChatGPT Plus de pago. Según OpenAI, ChatGPT puede utilizarse como socio de DALL-E 3 para ayudar a generar ideas y optimizar las instrucciones.
Si la imagen resultante se aproxima pero no es exactamente como se pretendía, el usuario puede corregirla indicando a ChatGPT qué debe cambiar. Según OpenAI, esta generación conversacional de imágenes debería reducir la necesidad de utilizar mensajes complicados. La empresa afirma que ya no es necesaria la complicada «ingeniería de avisos».
OpenAI afirma que todas las imágenes generadas por DALL-E 3 son propiedad de sus creadores. Las imágenes pueden reutilizarse, comercializarse y venderse.
El lanzamiento de DALL-E 3 en ChatGPT-Plus, ChatGPT Enterprise y a través de API está previsto para octubre. Una versión independiente de DALL-E 3 a través de OpenAI Labs, similar a DALL-E 2, llegará más adelante este otoño.
OpenAI ofrece a los artistas la posibilidad de excluirse de su trabajo – para un modelo futuro
Un cambio importante y una restricción en comparación con los sistemas de imagen existentes es que DALL-E 3 rechaza las indicaciones que incluyen los nombres de artistas vivos. Este es un método popular en otros sistemas de imagen para dar una dirección estilística al sistema.
Además, los artistas tienen la opción de excluir sus imágenes del entrenamiento de futuros (!) modelos de imagen de OpenAI. Esto, a su vez, podría significar que DALL-E 3 sigue siendo entrenado con el trabajo de estos artistas, lo que podría dar lugar a nuevas discusiones sobre derechos de autor. OpenAI podría proporcionar versiones actualizadas de DALL-E 3 tras un periodo de exclusión.
Los mensajes con nombres de personajes famosos también deberían rechazarse por motivos de seguridad, para evitar, por ejemplo, que las imágenes de políticos generadas por la IA se hagan virales en las redes sociales, como ocurrió con Midjourney.
OpenAI planea abordar estos y otros riesgos, como la representación visual excesiva o insuficiente, o el uso indebido con fines propagandísticos, con técnicas de red-teaming. OpenAI también está probando internamente una herramienta que puede detectar si una imagen ha sido generada con DALL-E 3.