El responsable de investigaci贸n de IA de Meta desea que cambien las licencias de c贸digo abierto

A帽adir a tus IAs favoritasQuitar de tus favoritasQuitar de favoritos 0
Puntuaci贸n0

2023-11-24 00:10:47

馃摪 Resumen del art铆culo:

– Meta ha lanzado su modelo de lenguaje Llama 2 como c贸digo abierto, pero con limitaciones que no cumplen con los requisitos de la Iniciativa de C贸digo Abierto.
– La compa帽铆a argumenta que su enfoque limitado de apertura es necesario para equilibrar los beneficios de compartir informaci贸n y los posibles costos para su negocio.
– Meta ha trabajado en proyectos abiertos en el pasado y espera fomentar la misma emoci贸n alrededor de sus modelos de IA generativa.

En julio, Meta lanz贸 su modelo de lenguaje Llama 2 relativamente abierto y de forma gratuita, en marcado contraste con sus mayores competidores. Sin embargo, en el mundo del software de c贸digo abierto, algunos todav铆a ven la apertura de la compa帽铆a con un asterisco.

Aunque la licencia de Meta hace que Llama 2 sea gratuito para muchos, a煤n es una licencia limitada que no cumple con todos los requisitos de la Open Source Initiative (OSI). Seg煤n se establece en la Definici贸n de C贸digo Abierto de la OSI, el c贸digo abierto va m谩s all谩 de simplemente compartir c贸digo o investigaci贸n. Para ser verdaderamente de c贸digo abierto, se debe ofrecer redistribuci贸n gratuita, acceso al c贸digo fuente, permitir modificaciones y no estar ligado a un producto espec铆fico. Las limitaciones de Meta incluyen requerir una tarifa de licencia para cualquier desarrollador con m谩s de 700 millones de usuarios diarios y no permitir que otros modelos se capaciten en Llama. Investigadores de la Universidad de Radboud en los Pa铆ses Bajos afirmaron que Meta afirmar que Llama 2 es de c贸digo abierto 芦es enga帽oso禄, y publicaciones en las redes sociales cuestionaron c贸mo Meta pod铆a afirmarlo.

Joelle Pineau, vicepresidenta de investigaci贸n de IA de Meta, que dirige el centro de Investigaci贸n Fundamental de IA (FAIR) de la empresa, es consciente de los l铆mites de la apertura de Meta. Sin embargo, argumenta que es un equilibrio necesario entre los beneficios de compartir informaci贸n y los posibles costos para el negocio de Meta. En una entrevista con The Verge, Pineau dice que incluso el enfoque limitado de Meta hacia la apertura ha ayudado a sus investigadores a adoptar un enfoque m谩s centrado en sus proyectos de IA.

La divisi贸n de IA de Meta ha trabajado en proyectos m谩s abiertos anteriormente. Una de las mayores iniciativas de c贸digo abierto de Meta es PyTorch, un lenguaje de programaci贸n de aprendizaje autom谩tico utilizado para desarrollar modelos de IA generativa. La compa帽铆a lanz贸 PyTorch a la comunidad de c贸digo abierto en 2016 y los desarrolladores externos han estado iterando en 茅l desde entonces. Pineau espera fomentar la misma emoci贸n en torno a sus modelos de IA generativa, especialmente porque PyTorch 芦ha mejorado mucho禄 desde que se lanz贸 como c贸digo abierto.

Pineau dice que la elecci贸n de cu谩nto lanzar depende de varios factores, incluida la seguridad del c贸digo en manos de desarrolladores externos. Es importante para FAIR que 芦un conjunto diverso de investigadores禄 vea su investigaci贸n para obtener mejores comentarios. Es el mismo ethos que Meta utiliz贸 cuando anunci贸 el lanzamiento de Llama 2, creando la narrativa de que la compa帽铆a cree que la innovaci贸n en IA generativa debe ser colaborativa.

Pineau dice que Meta participa en grupos de la industria como Partnership on AI y MLCommons para ayudar a desarrollar referencias de modelos de base y pautas para la implementaci贸n segura de modelos. Prefiere trabajar con grupos de la industria, ya que cree que ninguna compa帽铆a puede liderar la conversaci贸n sobre una IA segura y responsable en la comunidad de c贸digo abierto.

El enfoque de apertura de Meta se siente novedoso en el mundo de las grandes compa帽铆as de IA. OpenAI comenz贸 como una compa帽铆a m谩s abierta y centrada en la investigaci贸n abierta. Pero Ilya Sutskever, cofundador y cient铆fico jefe de OpenAI, dijo a The Verge que fue un error compartir su investigaci贸n, citando preocupaciones competitivas y de seguridad. Si bien Google ocasionalmente comparte documentos de sus cient铆ficos, tambi茅n ha mantenido en secreto el desarrollo de algunos de sus grandes modelos de lenguaje.

Los jugadores de c贸digo abierto de la industria tienden a ser desarrolladores m谩s peque帽os como Stability AI y EleutherAI, que han tenido cierto 茅xito en el espacio comercial. Los desarrolladores de c贸digo abierto regularmente lanzan nuevos LLM en los repositorios de c贸digo de Hugging Face y GitHub. Falcon, un LLM de c贸digo abierto del Technology Innovation Institute con sede en Dubai, tambi茅n ha ganado popularidad y compite con Llama 2 y GPT-4.

Es importante tener en cuenta, sin embargo, que la mayor铆a de las compa帽铆as de IA cerradas no comparten detalles sobre la recopilaci贸n de datos para crear sus conjuntos de datos de entrenamiento de modelos. Pineau dice que los esquemas de licencia actuales no se crearon para funcionar con software que recopila grandes cantidades de datos externos, como muchos servicios de IA generativa. La mayor铆a de las licencias, tanto de c贸digo abierto como propietarias, otorgan responsabilidad limitada a los usuarios y desarrolladores y una indemnizaci贸n muy limitada por infracci贸n de derechos de autor. Pero Pineau dice que los modelos de IA como Llama 2 contienen m谩s datos de entrenamiento y exponen a los usuarios a una responsabilidad potencialmente mayor si producen algo considerado infracci贸n. Las licencias de software actuales no cubren esa inevitabilidad.

Las personas de la industria han comenzado a analizar las limitaciones de algunas licencias de c贸digo abierto para LLM en el espacio comercial, mientras que otros argumentan que el verdadero c贸digo abierto es un debate filos贸fico en el mejor de los casos y algo en lo que los desarrolladores no se preocupan tanto. Stefano Maffulli, director ejecutivo de OSI, le dice a The Verge que el grupo entiende que las licencias aprobadas por OSI actualmente pueden no satisfacer ciertas necesidades de los modelos de IA. Dice que OSI est谩 revisando c贸mo trabajar con los desarrolladores de IA para proporcionar acceso transparente y sin permisos, pero seguro a los modelos.

Tambi茅n est谩 en proceso de crear una definici贸n de c贸digo abierto en relaci贸n con la IA. Dondequiera que te encuentres en el debate 芦驴Es Llama 2 realmente de c贸digo abierto?禄, no es la 煤nica medida potencial de apertura. Un informe reciente de Stanford, por ejemplo, mostr贸 que ninguna de las principales compa帽铆as con modelos de IA habla lo suficiente sobre los riesgos potenciales y su responsabilidad confiable si algo sale mal. Reconocer los riesgos potenciales y proporcionar v铆as para recibir comentarios no es necesariamente parte est谩ndar de las discusiones de c贸digo abierto, pero deber铆a ser una norma para cualquier persona que cree un modelo de IA.

Deja una opini贸n

Deje una respuesta

馃 AI MAFIA
Logo