Stability AI revoluciona la optimización de imágenes 3D con Fine-Tuning en Stable Diffusion [Exclusiva]

Añadir a tus IAs favoritasQuitar de tus favoritasQuitar de favoritos 0
Puntuación0

2023-11-06 01:48:41

Puntos destacados:

🚀 Stability AI ha presentado nuevas mejoras en su plataforma Stable Diffusion, incluyendo un modelo 3D y una herramienta para reemplazar el cielo en imágenes 2D. También ha añadido la función de Ajuste Fino a su plataforma, para agilizar el proceso de mejora de imágenes para casos de uso específicos.

🤝 Stability AI ha anunciado el evento AI Unleashed, una exclusiva reunión para líderes de datos empresariales. El evento ofrece la oportunidad de establecer contactos y aprender de otros profesionales del sector.

🔍 En un mercado cada vez más competitivo en la generación de texto a imagen, Stability AI busca diferenciarse ofreciendo características que van más allá de los modelos base, como el Reemplazador del cielo y el Ajuste Fino. Estas herramientas ofrecen mayor control y capacidad de personalización a los usuarios para adaptarse a sus flujos de trabajo y casos de uso específicos.

Stability AI ha anunciado hoy varias mejoras en su plataforma Stable Diffusion. Estas actualizaciones no solo ofrecen nuevas y emocionantes capacidades para la generación de texto a imagen, sino que también se adentran en el ámbito de la creación de contenido en 3D.

La mejora más destacada es el nuevo modelo Stable 3D. Hasta ahora, Stable Diffusion ha trabajado principalmente en la generación de imágenes bidimensionales (2D). El modelo Stable 3D cambiará eso, brindando funcionalidades que podrían ayudar en cualquier tipo de creación de contenido en 3D, incluido el diseño gráfico e incluso el desarrollo de videojuegos.

Junto con su incursión en la generación de contenido en 3D, Stability AI ha introducido la herramienta Reemplazador del cielo, que está diseñada para hacer exactamente lo que su nombre implica: reemplazar el cielo en imágenes 2D.

La plataforma Stable Diffusion también ofrece ahora el Ajuste Fino, diseñado para ayudar a las empresas a agilizar el proceso de mejora de imágenes para casos de uso específicos.

Además, la compañía integrará una marca de agua invisible para la autenticación de contenido en las imágenes generadas por la API de Stability AI. Las nuevas actualizaciones se centran en ayudar a las empresas con los flujos de trabajo de desarrollo creativo, ya que la IA generativa cada vez se integra más en los flujos de trabajo habituales.

«Se trata de proporcionar a los cuentacuentos creativos las herramientas que necesitan para tener ese nivel de control adicional sobre las imágenes», dijo Emad Mostaque, CEO de Stability AI, en una entrevista exclusiva con VentureBeat.

Stable Diffusion añade características en un panorama de GenAI cada vez más competitivo

Los avances de Stability AI llegan en un momento en que el mercado de generación de texto a imagen se vuelve altamente competitivo.

Adobe se ha dirigido al mercado con sus herramientas Firefly, que están estrechamente integradas con el software de diseño de la compañía. Midjourney ha estado agregando cada vez más características a su tecnología para ayudar a los diseñadores a generar imágenes. Por su parte, OpenAI recientemente lanzó sus modelos DALL-E 3 con capacidades mejoradas para generar texto dentro de las imágenes.

Mostaque es consciente de su competencia y tiene como objetivo diferenciar a Stability AI de varias formas. En particular, enfatizó que su compañía está dejando de ser solo modelos para convertirse en un facilitador de flujos de trabajo creativos. Con las nuevas características de Reemplazador del cielo y Ajuste Fino, señaló que son pasos adicionales que van más allá de lo que se encuentra en un modelo base para generar imágenes.

Reemplazador del cielo no es solo una característica, es un objetivo para un caso de uso empresarial

El concepto de reemplazar el fondo de una imagen no es nuevo. En aplicaciones de IA no generativa, los fondos suelen ser reemplazados por técnicas como pantallas verdes y claves de croma.

Mostaque dijo que Stability AI está construyendo sobre esas técnicas clásicas y automatizando el flujo de trabajo para que el proceso sea rápido y eficiente para los usuarios empresariales. Cambiar el color del fondo del cielo no es solo agregar un toque creativo, es una capacidad que tiene un caso de uso muy específico y práctico.

«El Reemplazador del cielo es genial para el sector inmobiliario, por ejemplo», dijo Mostaque.

Mostaque señaló que los usuarios desean poder tener diferentes fondos con diferentes efectos de iluminación. Fundamentalmente, enfatizó que se trata de ofrecer control, ya que las organizaciones tienen sus propios flujos de trabajo para generar imágenes y contenido. Lo que está haciendo Stability AI es construir flujos de trabajo optimizados para ayudar a habilitar el control que requieren diferentes casos de uso.

«El Reemplazador del cielo es el primero de una serie de ellos que lanzaremos en diferentes sectores específicos y empresariales, basados en las experiencias que hemos tenido en los últimos seis a 12 meses», dijo.

Stable 3D extiende Stable Diffusion para nuevos casos de uso

El nuevo modelo Stable 3D funciona ampliando el modelo de difusión utilizado en Stable Diffusion para incluir conjuntos de datos 3D adicionales y vectorización.

«Estoy muy emocionado por la capacidad de crear mundos enteros en 3D», dijo Mostaque.

Mostaque explicó que Stable 3D se construyó a partir de Stable Diffusion y del trabajo de Stability AI en Objaverse-XL, que es uno de los conjuntos de datos 3D abiertos más grandes del mundo. La construcción y representación de imágenes 3D ha sido durante mucho tiempo un proceso intensivo en recursos, pero Mostaque confía en que Stable 3D sea más eficiente que los enfoques tradicionales de generación de imágenes 3D. Enfatizó que todavía es temprano para Stable AI, pero confía en que la tecnología evolucionará y se expandirá gradualmente con el tiempo. Initialmente, Stable 3D estará disponible como una vista previa privada.

«Esto es increíblemente eficiente en comparación con el tipo de creación clásica de modelos 3D que llevaba mucho tiempo construir», dijo. «Ahora se pueden obtener rápidamente las primeras versiones de cosas que antes llevaban mucho tiempo construir».

Marcas de agua y la EO de Biden sobre IA

Con la Orden Ejecutiva (EO) de la Administración Biden de esta semana sobre IA, una de las directivas es integrar marcas de agua en el contenido generado.

Stability AI está integrando marcas de agua invisibles y Credenciales de contenido en su API. Credenciales de contenido es un esfuerzo de la industria en el que participan Adobe y otros para proporcionar información sobre la autoría del contenido. Mostaque dijo que agregar marcas de agua invisibles y Credenciales de contenido es lo responsable. También forma parte de un esfuerzo más amplio en el que Stability AI está trabajando para brindar autenticidad al contenido generado.

«Estamos liderando varias iniciativas y otras adicionales que estamos anunciando en torno a esto, así como investigaciones adicionales, porque queremos saber qué es real y qué es falso», dijo Mostaque. «También ayuda con algunos de los mecanismos de atribución y otras cosas que estamos construyendo para futuros lanzamientos».

Deja una opinión

      Deje una respuesta

      🤖 AI MAFIA
      Logo