
2023-09-18
La startup estadounidense Suno está especializada en la generación de audio mediante IA a partir de texto. Su último modelo de audio genera unas canciones impresionantes.
A principios de septiembre, Suno presentó su último modelo de conversión de texto en canción, Chirp v1, que puede generar música, incluso voces, basándose en el estilo y la letra. La mayor mejora es que v1 puede convertir en música géneros como rock, pop, K-pop, y descripciones como melódico o rápido.
Las letras ahora se pueden dividir en partes usando comandos como [verse] y [chorus] para dar más estructura a las canciones generadas. Las letras pueden escribirse o generarse directamente en la interfaz de Chirp mediante ChatGPT.
La startup señala que no se admiten prompts con una referencia específica a un artista, probablemente para evitar discusiones sobre derechos de autor. Este fue el caso cuando una canción generada por IA con las voces de Drake y The Weeknd se hizo viral. La canción fue bloqueada por Universal Music Group.
Generación de canciones por IA en Discord
La generación de Chirp está totalmente integrada en Discord, de forma similar a Midjourney. Para cada petición de Chirp, el modelo genera dos variaciones, normalmente de entre 20 y 40 segundos de duración. Si te gusta una variación, puedes generar más haciendo clic en «Continuar», lo que puede añadir hasta 30 segundos a una generación mientras continúa el estilo de la generación anterior.
Si quieres inspirarte o conocer el potencial del Chirp, no tienes más que navegar por los servidores Discord: más de 40.000 usuarios se encargan de que haya un suministro constante de canciones. Seguro que encuentras alguna que otra joya, como esta canción de amor con motivaciones políticas. ¿Oiremos más pronto?
Vídeo: vía Chirp
También puedes tomar letras de canciones conocidas y dejar que la IA las genere en un nuevo estilo musical.
Vídeo: vía Chirp
La complejidad de las canciones combinada con la calidad de las voces generadas es a veces impresionante. Aún no hay ninguna canción en las listas de éxitos, pero al ritmo actual de desarrollo de la IA generativa, esto podría cambiar rápidamente. Suno ha publicado algunos demos que suenan especialmente bien del nuevo modelo en un sitio web.
Suno admite más de 50 idiomas, siendo el inglés y la música rock los que mejor funcionan en mis pruebas. El estilo también parece estar influido por el contenido o la estructura de la letra. A partir de la letra, se genera una imagen de fondo adecuada para cada clip de audio.
Chirridos gratuitos en Discord
Suno ofrece 250 créditos gratis al mes en Discordlo que equivale a 25 chirps. Los chirps se pueden generar en el servidor público o en los DMs de Discord. Un plan Pro ofrece 1000 créditos / hasta 100 chirps al mes y cuesta 10$ al mes. Puedes adquirir generaciones adicionales. Puedes encontrar más información sobre los modelos de pago aquí.
Última primavera, Suno introdujo Barkun modelo de texto a voz y audio que está disponible gratuitamente en Github bajo la licencia MIT para uso comercial. Bark también está disponible a través de Discord.