Stability AI lanza SVD 1.1, un modelo de difusi贸n para videos de inteligencia artificial m谩s consistentes

A帽adir a tus IAs favoritasQuitar de tus favoritasQuitar de favoritos 0
Puntuaci贸n+2

2024-02-10 19:19:14

Stability AI, la empresa conocida por su creciente variedad de modelos de inteligencia artificial de c贸digo abierto para la creaci贸n de contenido y codificaci贸n, anunci贸 hoy una actualizaci贸n para su modelo de difusi贸n latente de imagen a video, Difusi贸n de Video Estable (SVD).

Denominado SVD 1.1, el modelo actualizado es una versi贸n optimizada de SVD 1.0, optimizada para generar videos cortos de inteligencia artificial con mejor movimiento y m谩s consistencia.

En una publicaci贸n anunciando la actualizaci贸n, Tom Mason, el CTO de Stability AI, confirm贸 que el nuevo modelo est谩 disponible para uso p煤blico y se puede descargar a trav茅s de Hugging Face.

La disponibilidad del modelo ser谩 parte de las membres铆as de suscripci贸n de Stability, las cuales ofrecen diferentes niveles para usuarios individuales y empresariales, con opciones que van desde gratuita hasta premium por $20 al mes y superiores. Aquellos interesados en utilizar el nuevo SVD 1.1 para prop贸sitos comerciales necesitar谩n adquirir una membres铆a adicional.

驴Qu茅 ofrece el SVD 1.1 de Stability AI?

Recordemos noviembre de 2023, cuando Stability lanz贸 dos modelos para inteligencia artificial en videos: SVD y SVD-XT. El primero era el modelo b谩sico que tomaba una imagen est谩tica como referencia y generaba un video de cuatro segundos con hasta 14 cuadros. Por otro lado, SVD-XT era una versi贸n mejorada que, siguiendo el mismo principio, produc铆a hasta 25 cuadros en esos cuatro segundos.

Ahora, centrando la atenci贸n en el SVD 1.1, Stability ha presentado una actualizaci贸n significativa. Este modelo, seg煤n la empresa, sigue generando videos de cuatro segundos con 25 cuadros, pero ahora a una resoluci贸n de 1024脳576, manteniendo un marco de referencia del mismo tama帽o.

Lo m谩s relevante es la expectativa de que esta nueva versi贸n proporcione salidas de video m谩s coherentes en comparaci贸n con el modelo original.

Por ejemplo, en muchas ocasiones, tanto SVD como SVD-XT ten铆an dificultades para ofrecer un realismo fotogr谩fico completo, generaban videos est谩ticos o con movimientos de c谩mara muy lentos, y no lograban generar caras y personas de manera convincente. Se espera que todos estos problemas sean cosa del pasado con el SVD 1.1, que promete mejorar significativamente la fluidez de las salidas.

芦Se ha realizado un ajuste fino (para el SVD 1.1) manteniendo el condicionamiento fijo a 6 FPS y el ID de cubo de movimiento en 127 para mejorar la consistencia de las salidas sin necesidad de modificar los hiperpar谩metros. Estas condiciones siguen siendo ajustables y no se han eliminado. El rendimiento fuera de los ajustes de condicionamiento fijo puede variar en comparaci贸n con el SVD 1.0禄, menciona la empresa en la p谩gina de Hugging Face dedicada al nuevo modelo.

El verdadero rendimiento del SVD 1.1 est谩 a煤n por verse

Aunque Stability afirma mejoras en el rendimiento con el SVD 1.1, a煤n es necesario comprobar c贸mo funciona exactamente en la pr谩ctica. La p谩gina de Hugging Face del modelo advierte que este est谩 destinado principalmente a fines de investigaci贸n y se帽ala que algunos de los problemas originales a煤n podr铆an persistir.

Es importante destacar que, adem谩s de estar disponible en Hugging Face, los modelos de Difusi贸n de Video Estable tambi茅n pueden ser utilizados a trav茅s de la API proporcionada por la plataforma de desarrolladores de Stability AI. Esto brinda a los desarrolladores una manera sencilla de integrar la generaci贸n avanzada de video en sus productos.

芦鈥 Hemos lanzado la API de Difusi贸n de Video Estable, la cual genera videos de 4 segundos a 24 FPS en formato MP4, incluyendo 25 cuadros generados y los cuadros interpolados restantes. Admitimos control de fuerza de movimiento y m煤ltiples dise帽os y resoluciones, incluyendo 1024脳576, 768脳768 y 576脳1024,禄 coment贸 Mason en su publicaci贸n.

El a帽o pasado, Stability AI marc贸 un hito en la inteligencia artificial generativa con lanzamientos frecuentes de modelos. El a帽o 2024 parece seguir esta tendencia. La empresa, fundada en 2019 y que ha obtenido un financiamiento significativo, incluyendo una ronda de $101 millones anunciada en 2022, se encuentra entre los l铆deres en este campo. Sin embargo, no est谩 sola en la competencia. Ofertas competitivas como Runway y Pika tambi茅n est谩n ganando terreno, especialmente con sus plataformas web centradas en el cliente, que no solo generan videos, sino que tambi茅n ofrecen opciones de personalizaci贸n y mejora con facilidad.

Recientemente, el competidor Runway introdujo Multi Motion Brush en su plataforma, lo que permite a los usuarios agregar movimiento a partes espec铆ficas de sus videos de inteligencia artificial. Por otro lado, Pika, otra empresa en el campo de la generaci贸n de videos de inteligencia artificial, permite a los usuarios modificar regiones espec铆ficas en sus videos, como cambiar una cara de vaca por la de un pato. Sin embargo, ambas plataformas a煤n no ofrecen sus modelos a trav茅s de APIs, lo que limita la integraci贸n por parte de los desarrolladores en sus respectivas aplicaciones.

Deja una opini贸n

Deje una respuesta

馃 AI MAFIA
Logo