2023-12-03 15:34:56
Resemble AI es un conjunto de herramientas de voz que utiliza GPT 3.5 y sus propios modelos disponibles a través de una API.
Algunas de las herramientas clave de Resemble son la clonación de voces, la mezcla de voces y la localización. La función de localización permite crear voces sintéticas en varios idiomas, ampliando el alcance de los contenidos a una audiencia global.
La función de mezcla de voces de Resemble permite a los usuarios combinar voces humanas y sintéticas para obtener una experiencia de audio perfecta.
Tecnología de IA
El conjunto de herramientas de Resemble AI incluye funciones de texto a voz, voz a voz, edición neural de audio y doblaje de voz para una amplia gama de aplicaciones. El doblaje de voz es impresionante.
La función de emoción de la plataforma añade una gama infinita de emociones al habla sin necesidad de nuevos datos, lo que proporciona una comunicación más matizada y auténtica.
También admite transformaciones de voz a voz en tiempo real con control granular de la inflexión y la entonación.
Casos prácticos
Resemble AI afirma haber perfeccionado su producto con 200.000 voces de IA que producen más de dos millones de minutos de audio al mes. Resemble AI ha encontrado un amplio uso en diversas industrias, incluso a nivel empresarial.
El paquete Resemblezer Python puede utilizarse para la verificación de locutores, la digitalización, la detección de falsificaciones profundas, etc.
Desarrollo de juegos
Con un sencillo plugin de Unity, los desarrolladores de juegos pueden crear voces y recursos de voz únicos, adjuntarlos a los personajes y animarlos.
En Github hay disponible código de ejemplo para un proyecto Alexa Skill que muestra cómo integrar dinámicamente texto generado por IA utilizando GPT-3 con una voz personalizada potenciada por Resemble. Esto es un poco técnico para los usuarios estándar.
Fundadores
La fuerza motriz de Resemble AI son sus cofundadores, Saqib Muhammad y Zohaib Ahmed.
Muhammad vive en California, pero estudió en Canadá. Es licenciado en empresariales por McGill y ha trabajado en empresas de gestión de capital.
Ahmed es desarrollador de software y trabajó en Blackberry. Estudió Informática en la Universidad de Toronto.
Precios
Resemble AI ofrece un modelo de precios flexible que se adapta a las necesidades del usuario.
El plan «Básico» es de pago por uso e incluye voces personalizadas grabadas en la web, localización al español (MX) y al francés, y acceso a más de 50 voces del mercado. El precio por segundo es de 0,006 dólares.
Para necesidades más amplias, el plan «Pro» incluye funciones adicionales como carga de datos personalizados, control avanzado de emociones, API de baja latencia y soporte multilingüe en más de 24 idiomas. Los precios no están disponibles públicamente.
Ambos planes incluyen usuarios y proyectos de equipo ilimitados, con funciones más avanzadas disponibles en el plan Pro.