El mini LLM Phi-2 de Microsoft ya es de código abierto y supuestamente mejor que el Google Gemini Nano

14 Views 0

GuardarSavedRemoved 0

Añadir a tus IAs favoritasQuitar de tus favoritasQuitar de favoritos 0

Puntuación0

2024-01-08 11:20:43

Microsoft está lanzando Phi-2 bajo la Licencia de código abierto MIT. La licencia MIT es una licencia permisiva que permite el uso comercial, la distribución, la modificación y el uso privado del software licenciado. La única condición es que conserve los avisos de copyright y licencia.

Esta licencia también concede permiso para utilizar, copiar, modificar, fusionar, publicar, distribuir, sublicenciar y/o vender copias del software. Sin embargo, el software, en este caso el modelo de IA, se proporciona «tal cual», sin ninguna garantía ni responsabilidad por parte de los autores o titulares de los derechos de autor.

Phi-2 es el modelo de lenguaje más pequeño de Microsoft. Los nuevos benchmarks de la compañía muestran que supera al Gemini Nano de Google.

El mini LLM Phi 2 de Microsoft ya es de codigo 2024-01-08 11:20:43 — Bild: Microsoft

Phi-2 Clama Superioridad sobre Gemini Nano

Phi-2, un modelo de lenguaje especialmente compacto, ha emergido de la serie de pruebas revelando un desempeño que eclipsa al Nano de la familia Gemini de Google. Microsoft ha confirmado mediante diversos benchmarks con modelos previos como Llama-2, Mistral 7B, y el mismo Gemini Nano, que el modelo Phi-2 brinda resultados superiores en todas las métricas evaluadas. Estos resultados han sido corroborados mediante ensayos consistentes con mensajes de uso frecuente, anticipando un impacto significativo sobre dispositivos como el próximo Pixel 8.

El predecesor directo de Phi-2, el modelo Phi-1.5 con 1.300 millones de parámetros, ya había sorprendido al poder competir con modelos hasta diez veces más grandes en tareas de composición poética, escritura de correos y análisis de texto y de imágenes. Ahora, Phi-2 muestra avances notables en seguridad y razonamiento lógico, presentándose como una opción robusta y eficiente para la implementación tanto en la nube como en dispositivos periféricos.

Microsoft también ha realizado pruebas exhaustivas con mensajes de uso frecuente. La conclusión: «Observamos un comportamiento acorde con la expectativa que teníamos dados los resultados del benchmark».

Gemini Nano se utilizará en dispositivos finales como el Pixel 8.

En junio, investigadores de Microsoft presentaron Phi-1, un modelo de lenguaje basado en transformadores y optimizado para código con sólo 1.300 millones de parámetros. El modelo se entrenó exclusivamente con datos de alta calidad y superó en pruebas comparativas a modelos hasta diez veces mayores.

Phi-1.5 le siguió unos meses después, también con 1.300 millones de parámetros y entrenado con datos adicionales consistentes en varios textos generados por IA. Phi-1.5 puede componer poemas, escribir correos electrónicos e historias y resumir textos. Una variante también puede analizar imágenes. En las pruebas de sentido común, comprensión del lenguaje y razonamiento, el modelo fue capaz en algunas áreas de seguir el ritmo de modelos con hasta 10.000 millones de parámetros.

Microsoft ha anunciado ahora Phi-2, que con 2.700 millones de parámetros es el doble de grande, pero sigue siendo diminuto en comparación con otros modelos lingüísticos. En comparación con Phi-1.5, el modelo muestra mejoras espectaculares en razonamiento lógico y seguridad, según la empresa. Con el ajuste y la personalización adecuados, el pequeño modelo de lenguaje es una potente herramienta para aplicaciones en la nube y en los bordes, afirma la empresa.

Innovación en Modelos de IA de Microsoft

Phi-2 se encuentra ya accesible en Azure AI como parte de una colección que incluye SEM, CLIP y varios otros, reafirmando la estrategia de «Modelos como servicio» de Microsoft. Esta novedosa propuesta permitirá a los desarrolladores profesionales integrar los modelos de IA más avanzados en sus aplicaciones, ajustándolos con datos propios y sin las cargas que supone el manejo de infraestructuras de GPU. Esta iniciativa abre la puerta a una era de implementaciones más sencillas y acceso democrático a la última tecnología de inteligencia artificial.

Según los resultados, Phi-2 supera al modelo Llama-2-7B de Meta en algunas áreas. También se está preparando una versión de Phi-2 para chat, que podría subsanar algunas de las deficiencias del modelo en estos ámbitos.

El modelo Phi-2 destaca en matemáticas y programación

El equipo de Microsoft Research aún retiene algunos detalles de Phi-2. No obstante, Sebastien Bubeck, líder de Fundamentos de Aprendizaje Automático en Microsoft Research, ha compartido resultados prometedores en la prueba «MT-Bench», los cuales sugieren que Phi-2 puede incluso superar a modelos como Llama-2-7B de Meta en ciertas capacidades. Además, una futura versión de Phi-2 adaptada para conversación se encuentra en desarrollo, con el potencial de superar las limitaciones actuales del modelo en interacción chat.

El mini LLM Phi-2 de Microsoft ya es de código abierto y supuestamente mejor que el Google Gemini Nano

Innovación en Modelos de IA de Microsoft

El modelo Phi-2 destaca en matemáticas y programación

Innovación en Modelos de IA de Microsoft

El modelo de vídeo "Fairy" de Meta ofrece un anticipo de la edición de vídeo asistida por IA

Nueva versión de Siri con inteligencia artificial generativa nuevamente rumoreada para WWDC

Investigadores chinos utilizan LLMs para el control de drones militares

Aumento de pedidos del chip H20 de Nvidia tras la adopción de modelos de IA DeepSeek por empresas chinas.

Microsoft revela que los hackers pueden eludir 100 herramientas de IA sin necesidad de matemáticas complejas

Nuevo API de Black Forest Labs permite ajustar modelos Flux Pro con solo unos pocos ejemplos

Deje una respuesta Cancelar respuesta