2023-10-12 08:59:52
Puntos destacados:
🚀 Lanzamiento de Stable LM 3B, un modelo de lenguaje compacto y de alto rendimiento.
💼 Aplicaciones ampliadas en dispositivos portátiles y PC de hogar.
🔝 Mejor rendimiento y capacidades superiores en comparación con modelos de mayor tamaño.
Hoy, lanzamos con orgullo una versión experimental de Stable LM 3B, la última incorporación a nuestra suite de soluciones de inteligencia artificial generativa de alto rendimiento. Con 3 mil millones de parámetros (en comparación con los 7 a 70 mil millones de parámetros que se utilizan típicamente en la industria), Stable LM 3B es un modelo de lenguaje compacto diseñado para funcionar en dispositivos digitales portátiles como dispositivos móviles y ordenadores portátiles, y estamos emocionados por sus capacidades y portabilidad.
Al igual que nuestro último lanzamiento de Stable LM, una de las principales ventajas de Stable LM 3B es su tamaño más reducido y su eficiencia. A diferencia de los modelos más grandes, estos modelos requieren menos recursos y tienen costes de funcionamiento más bajos, lo que los hace muy accesibles para la mayoría de los usuarios. Esto no solo los hace más asequibles, sino que también los convierte en modelos respetuosos con el medio ambiente, ya que consumen mucha menos energía. Pero no te dejes engañar por su tamaño; Stable LM 3B es altamente competitivo, superando a los modelos de lenguaje de parámetros de 3B del estado de la técnica anterior e incluso a algunos de los mejores modelos de lenguaje de código abierto a escala de 7B de parámetros.
El desarrollo de Stable LM 3B amplía el rango de aplicaciones viables en dispositivos portátiles o PCs de hogar. Esto significa que tanto individuos como empresas ahora pueden desarrollar tecnologías de vanguardia con sólidas capacidades de conversación, como asistencia en escritura creativa, al tiempo que mantienen bajos costes y un alto rendimiento.
En comparación con nuestro anterior lanzamiento de Stable LM, esta versión es significativamente mejor para producir texto manteniendo una ejecución rápida. Tiene un mejor rendimiento en tareas de procesamiento de lenguaje natural comunes, como razonamiento de sentido común y pruebas de conocimiento general. Para lograr este rendimiento excepcional, Stable LM 3B ha sido sometido a un riguroso entrenamiento. Se entrenó durante múltiples épocas con datos de alta calidad, lo que resultó en un modelo de lenguaje que supera el rendimiento de sus predecesores a tamaños similares.
Stable LM 3B también es versátil. Aunque es un modelo de lenguaje general, se puede ajustar para usos alternativos, como asistencia en programación. Esto podría permitir a las empresas personalizar este modelo de manera rentable en sus datos, por ejemplo, como asistente de atención al cliente o asistente de programación para un lenguaje de programación especializado, etc.
Los desarrolladores deben tener en cuenta que Stable LM 3B es un modelo base. Esto significa que debe ajustarse para garantizar un rendimiento seguro en aplicaciones específicas, como una interfaz de chat. Dependiendo de su caso de uso, los desarrolladores deben evaluar y ajustar el modelo antes de implementarlo. Nuestro modelo instruido ajustado está siendo sometido actualmente a pruebas de seguridad y planeamos lanzarlo pronto.
Creemos firmemente que modelos más pequeños y personalizables como Stable LM 3B desempeñarán un papel cada vez más importante en casos de uso prácticos para la inteligencia artificial generativa, y que los modelos abiertos se convertirán en el estándar para la inteligencia artificial auditada y confiable. Este es un lanzamiento intermedio antes de nuestro lanzamiento completo, y alentamos a la comunidad a probar el modelo descargando los pesos en la plataforma Hugging Face. Este modelo actual se publica bajo la licencia de código abierto CC-By-SA 4.0.
Para obtener más información sobre este lanzamiento o para proporcionar comentarios, envíenos un correo electrónico a research@stability.ai.