2024-02-09 06:55:38
Un nuevo modelo de lenguaje de código abierto ha reclamado el trono como el mejor del mundo, según las últimas clasificaciones de Hugging Face, una de las principales plataformas de investigación y aplicaciones de procesamiento de lenguaje natural (NLP).
El modelo, llamado «Smaug-72B», fue lanzado públicamente hoy por la startup Abacus AI, que ayuda a las empresas a resolver problemas difíciles en el espacio de inteligencia artificial y aprendizaje automático.
Smaug-72B representa una evolución técnica significativa respecto a Qwen-72B, un avanzado modelo de lenguaje previamente desarrollado por el equipo de investigadores de Alibaba Group.
Esta innovación se destaca principalmente por su capacidad para superar a GPT-3.5 y Mistral Medium, modelos de punta en el ámbito de inteligencia artificial creados por OpenAI y Mistral, respectivamente. En comparación con estos, así como con su predecesor Qwen-72B, Smaug-72B ha demostrado un rendimiento superior en una amplia gama de benchmarks reconocidos, consolidando su posición como líder en el campo de la tecnología de modelado de lenguaje.
Crédito: Abacus AI
Según el Hugging Face Open LLM leaderboard, que mide el rendimiento de los modelos de lenguaje de código abierto en una variedad de tareas de comprensión y generación de lenguaje natural, Smaug-72B es ahora el primer y único modelo de código abierto que tiene una puntuación promedio superior a 80 en todas las principales evaluaciones de LLM.
Aunque actualmente el modelo no alcanza el nivel humano, con un promedio de 90-100 puntos, su aparición marca un hito importante en el camino hacia la equiparación de la inteligencia artificial de código abierto con las capacidades de las grandes empresas tecnológicas, las cuales han mantenido sus avances en secreto durante mucho tiempo.
+Este lanzamiento de Smaug-72B no solo representa la llegada de una nueva herramienta, sino que también sugiere un cambio de paradigma en el panorama de la IA. Podría ser el comienzo de una era en la que la innovación y el progreso en inteligencia artificial se democratizan, permitiendo a una gama más amplia de actores contribuir al avance de esta tecnología. En consecuencia, el impacto de Smaug-72B va más allá de ser solo un hito técnico; podría transformar fundamentalmente la forma en que la sociedad interactúa y se beneficia de la inteligencia artificial, liberando su potencial creativo y democratizando su desarrollo más allá de las fronteras de unas pocas corporaciones tecnológicas dominantes.
La ventaja del código abierto
«¡Smaug-72B de Abacus AI está ahora disponible en Hugging Face, encabezando la lista de los mejores modelos de lenguaje de máquina con una impresionante puntuación promedio de 80!», anunció con entusiasmo la CEO de Abacus AI, Bindu Reddy, en una publicación en X.com.
«En nuestro siguiente paso, planeamos detallar estas innovadoras técnicas en un artículo de investigación y aplicarlas a algunos de los principales modelos de Mistral, incluido miqu (una adaptación refinada de 70B de LLama-2)», agregó. «Nuestras estrategias se enfocan especialmente en el razonamiento y las habilidades matemáticas, lo que explica las sobresalientes calificaciones de GSM8K. Nuestro próximo artículo proporcionará una explicación detallada al respecto.»
Con este lanzamiento, Smaug-72B se erige como el primer modelo de código abierto en lograr una destacada puntuación promedio de 80 en la tabla de clasificación de Hugging Face Open LLM, marcando un hito significativo en el ámbito del procesamiento del lenguaje natural y la inteligencia artificial de código abierto.
Smaug-72B – El mejor modelo de código abierto del mundo – ¡En la cima del Hugging LLM LeaderBoard! Smaug72B de Abacus AI está disponible ahora en Hugging Face, está en la cima de la tabla de clasificación de LLM y es el primer modelo con una puntuación promedio de 80! En otras palabras, es el mejor… pic.twitter.com/CGHawmLhqI – Bindu Reddy (@bindureddy) 6 de febrero de 2024
Smaug-72B sobresale especialmente en tareas de razonamiento y matemáticas, gracias a las técnicas que Abacus AI aplicó al proceso de ajuste fino. Estas técnicas, que se detallarán en un próximo artículo de investigación, apuntan a las debilidades de los modelos de lenguaje grandes y mejoran sus capacidades.
Smaug-72B no es el único modelo de lenguaje de código abierto que ha sido noticia recientemente. Qwen, el grupo detrás de Qwen-72B, también lanzó Qwen 1.5, una suite de pequeños y potentes modelos de lenguaje que van desde 0.5B hasta 72B de parámetros.
Qwen 1.5 supera a modelos propietarios populares como Mistral-Medium y GPT-3.5, tiene una longitud de contexto de 32k y funciona con varias herramientas y plataformas para inferencias rápidas y locales. Qwen también ha hecho de Qwen-VL-Max de código abierto, un nuevo modelo grande de lenguaje visual que rivaliza con Gemini Ultra y GPT-4V, dos de los modelos de lenguaje visual más avanzados desarrollados por Google y OpenAI, respectivamente.
Implicaciones para el futuro de la IA
La aparición de Smaug-72B y Qwen 1.5 ha generado mucha emoción y debate en la comunidad de IA y más allá. Muchos expertos e influyentes han elogiado los logros de Abacus AI y Qwen y han expresado su admiración por su contribución a la IA de código abierto.
«Es difícil creer que hace menos de un año todos estábamos emocionados con modelos como Dolly», dijo Sahar Mor, una influencer y analista de IA, en una publicación en LinkedIn, celebrando el progreso de los modelos de código abierto en el último año.
Smaug-72B y Qwen 1.5 están actualmente disponibles en Hugging Face, donde cualquiera puede descargar, usar y modificarlos. Abacus AI y Qwen también han anunciado sus planes de presentar sus modelos a la tablase de clasificación de evaluación humana llmsys, que es un nuevo punto de referencia que evalúa el rendimiento de los modelos de lenguaje en tareas y escenarios similares a los humanos. Abacus AI y Qwen también han insinuado sus proyectos y objetivos futuros, que incluyen crear más modelos de código abierto y aplicarlos a varios dominios y aplicaciones.
Smaug-72B y Qwen 1.5 son ejemplos recientes de la rápida evolución de la IA de código abierto. Estas innovaciones desafían el dominio de las grandes empresas tecnológicas, abriendo nuevas oportunidades para todos. La posición de Smaug-72B en la tabla de clasificación de Hugging Face es temporal, pero refleja el momento prometedor de la IA de código abierto.