Introducción
El mundo de la inteligencia artificial está siempre en constante evolución, y una de las compañías líderes en el campo, Anthropic, acaba de anunciar su más reciente innovación: el modelo de lenguaje de aprendizaje profundo conocido como Claude 2. En este artículo, examinaremos tres aspectos clave de Claude 2:
- Las mejoras de rendimiento y capacidad de Claude 2 en comparación con su predecesor.
- La seguridad y la reducción de resultados potencialmente dañinos.
- El uso y la accesibilidad de Claude 2 para usuarios y empresas.
Mejoras de rendimiento de Claude 2
Anthropic ha trabajado arduamente para mejorar el rendimiento de Claude 2 en comparación con su predecesor, Claude 1.3. Claude 2 se destaca por sus respuestas más largas y su habilidad mejorada para codificar, resolver problemas matemáticos y razonar. Como ejemplo, en el examen de opción múltiple del Bar, Claude 2 obtuvo un impresionante 76.5%, un aumento del 73.0% en comparación con Claude 1.3.
Claude 2 también ha demostrado su capacidad académica al superar el percentil 90 en los exámenes de lectura y escritura GRE en comparación con los estudiantes universitarios que solicitan escuelas de posgrado. Estos avances, junto con la capacidad de los usuarios para ingresar hasta 100K tokens en cada indicación, permiten a Claude trabajar en documentos técnicos extensos e incluso libros, generando documentos más largos, desde memorandos hasta historias de hasta unos miles de tokens, de una sola vez.
Anuncio de Claude 2
El 11 de julio de 2023, Anthropic anunció su nuevo modelo, Claude 2, el cual mejora el rendimiento y provee respuestas más largas que las versiones anteriores. Este modelo se puede acceder a través de una API y una nueva página web pública de beta, claude.ai. Claude 2 ha demostrado ser fácil de conversar, ofrece explicaciones claras sobre su razonamiento, es menos probable que produzca resultados dañinos y tiene una memoria más larga.
Mejoras
Claude 2 ha mejorado en programación, matemáticas y razonamiento. En el examen de opción múltiple de la prueba del Colegio de Abogados, obtuvo un 76.5%, en comparación con el 73.0% de Claude 1.3. En comparación con los estudiantes universitarios que se postulan a la escuela de posgrado, Claude 2 obtuvo más del 90% en los exámenes de lectura y escritura del GRE. Los usuarios pueden ingresar hasta 100,000 tokens en cada entrada, lo que permite a Claude trabajar en cientos de páginas de documentación técnica o incluso en un libro.
Habilidades de codificación
Claude 2 ha mejorado considerablemente sus habilidades de codificación. En el Codex HumanEval, una prueba de codificación en Python, Claude 2 obtuvo un 71.2%, en comparación con el 56.0% anterior. En el GSM8k, un conjunto grande de problemas matemáticos de nivel escolar, Claude 2 obtuvo un 88.0%, en comparación con el 85.2% anterior.
Seguridad
Se ha trabajado para mejorar la seguridad subyacente de Claude 2, haciéndolo más inofensivo y difícil de ser impulsado a producir salidas ofensivas o peligrosas. Según una evaluación interna, Claude 2 fue dos veces mejor al proporcionar respuestas inofensivas en comparación con Claude 1.3.
Disponibilidad
Claude 2 alimenta nuestra experiencia de chat y está generalmente disponible en los Estados Unidos y el Reino Unido. Se está trabajando para hacer a Claude más globalmente disponible en los próximos meses. Los usuarios pueden crear una cuenta y comenzar a hablar con Claude en lenguaje natural, pidiéndole ayuda con cualquier tarea que deseen.
Asociaciones comerciales
Actualmente, se está trabajando con miles de empresas que utilizan la API de Claude. Uno de los socios es Jasper, una plataforma de IA generativa que permite a los individuos y equipos ampliar sus estrategias de contenido. Otro socio es Sourcegraph, una plataforma de IA para códigos que ayuda a los clientes a escribir, corregir y mantener el código. Su asistente de codificación, Cody, utiliza la capacidad de razonamiento mejorada de Claude 2 para proporcionar respuestas aún más precisas a las consultas de los usuarios.
Retroalimentación
Anthropic invita a los usuarios a dar su retroalimentación mientras trabajan para desplegar sus productos de manera más amplia. La experiencia de chat está en un lanzamiento beta abierto, y los usuarios deben ser conscientes de que Claude, como todos los modelos actuales, puede generar respuestas inapropiadas.
Seguridad y Reducción de Resultados Dañinos
Uno de los desafíos más grandes en el campo de la inteligencia artificial es la seguridad y la reducción de salidas potencialmente dañinas. Anthropic ha hecho de este tema una prioridad en el desarrollo de Claude 2, haciendo que el modelo sea más seguro y menos propenso a producir resultados ofensivos o peligrosos. Según sus evaluaciones internas, Claude 2 fue dos veces mejor en proporcionar respuestas inofensivas en comparación con Claude 1.3.
Accesibilidad de Claude 2
Claude 2 no solo es un logro técnico, sino que también es accesible para los usuarios en Estados Unidos y Reino Unido a través de una nueva API y un sitio web público en beta, claude.ai. Los usuarios pueden hablar con Claude en lenguaje natural, pidiéndole ayuda con cualquier tarea que deseen.
Además, Anthropic está trabajando con miles de empresas que utilizan la API de Claude, incluyendo Jasper, una plataforma de IA generativa que ayuda a las personas y equipos a escalar sus estrategias de contenido, y Sourcegraph, una plataforma de IA de código que ayuda a los clientes a escribir, corregir y mantener código.
Claude 2, vs ChatGPT plus
Claude 2, en su hilo de Twitter. Según Couvert, Claude 2, lanzado por Anthropic, ofrece varias ventajas sobre ChatGPT:
- Es completamente gratis para usar.
- Maneja datos más recientes, algunos de principios de 2023.
- Acepta indicaciones (prompts) mucho más largas que ChatGPT.
- Puede analizar hasta 75,000 palabras, comparado con el límite de 32k tokens de los mejores modelos GPT-4.
- Permite administrar varios documentos a la vez y realizar preguntas sobre ellos.
- Es más eficiente en la codificación. En la prueba de codificación HumanEval, GPT-4 obtuvo un 67%, en comparación con el 71.2% de Claude 2.
- Su API es 4 a 5 veces más barata. La API GPT-4 (contexto 32k) cuesta $60/millón y $120 para finalización. La API de Claude 2 (contexto 100k) cuesta $11/millón y $32 para finalización.
Como contra, Claude solo está disponible en EE.UU. y Reino Unido, pero puede ser accesible desde otros lugares mediante el uso de una VPN o el navegador Opera. Alienta a sus seguidores a compartir la información para que todos puedan descubrir Claude 2.
Conclusión
Con la presentación de Claude 2, Anthropic ha demostrado su compromiso con la innovación y la mejora continua en el campo de la inteligencia artificial. La combinación de un rendimiento mejorado, seguridad avanzada y amplia accesibilidad hace de Claude 2 una poderosa herramienta en el futuro de la inteligencia artificial. A medida que continuamos explorando las capacidades y posibilidades de la IA, Claude 2 sin duda establece un nuevo estándar en el campo.