Anthropic lanza su último LLM Claude 2.1 mientras OpenAI se autodestruye

4 Views 0

GuardarSavedRemoved 0

Añadir a tus IAs favoritasQuitar de tus favoritasQuitar de favoritos 0

Puntuación0

2023-11-24 18:54:18

En plena crisis existencial de OpenAI, su competidor Anthropic presenta su nuevo modelo lingüístico y chatbot, Claude 2.1. Tiene una ventana contextual dos veces más grande que su predecesor y se dice que comete menos errores.

Con una ventana de contexto de 200K, Claude 2.1 de Anthropic supera la gran ventana de contexto de 100K de su predecesor, que a su vez fue superado por GPT-4 Turbo con una ventana de contexto de 128K a principios de noviembre. Con la ventana de contexto de 200K, Anthropic vuelve a ser el proveedor con el modelo de IA más atento del mercado.

La ventana de contexto describe la cantidad de contenido que el modelo lingüístico puede mirar simultáneamente al generar una respuesta. En el caso de Claude 2, se trata de aproximadamente 150.000 palabras o más de 500 páginas de material, según Anthropic.

Chateando la Ilíada

Los usuarios pueden cargar bases de código enteras, informes financieros o incluso grandes obras literarias como la Ilíada o la Odisea para que el modelo las procese, afirma Anthropic.

Claude puede realizar tareas de resumen, preguntas y respuestas, predicción de tendencias y comparación de varios documentos. Sin embargo, generar una respuesta puede llevar varios minutos, nada comparado con horas de trabajo humano, señala Anthropic.

Vídeo: Anthropic

En la práctica, sin embargo, las ventajas de estas grandes ventanas de contexto siguen siendo limitadas. Las pruebas demuestran que los grandes modelos lingüísticos recuperan el contenido con menos fiabilidad cuando ese contenido está más atrás y más en el centro de la entrada, el llamado fenómeno «perdido en el medio». Cuanto mayor es la entrada, mayor es el riesgo de error.

En la práctica, esto significa que se pueden introducir documentos de gran tamaño, pero es posible que algunas partes del documento no se incluyan en el análisis. El modelo encuentra la información de forma más fiable al principio de los documentos, como muestran las pruebas GPT-4 Turbo.

Pruebas independientes mostrarán lo bueno o malo que es Claude 2.1 en este aspecto. En cualquier caso, Anthropic promete mejoras significativas respecto a su predecesor, especialmente para contextos más largos.

El modelo muestra una reducción del 30 por ciento en las respuestas incorrectas y una «tasa 3-4 veces menor de concluir erróneamente que un documento apoya una afirmación concreta.»

Cuando el modelo es incierto, descarta casi el doble de respuestas y admite incertidumbre («No estoy seguro de cuál es la quinta ciudad más grande de Bolivia») que su predecesor.

Claude 2.1 debería ser más honesto y entender mejor las cosas

Según Anthropic, Claude 2.1 ha reducido la tasa de alucinaciones en un factor de dos en comparación con su predecesor, Claude 2.0. Como resultado, las organizaciones pueden crear aplicaciones de IA con mayor confianza y fiabilidad.

Con el nuevo modelo, Anthropic también está introduciendo una función beta llamada Uso de herramientas, que permite a Claude integrarse con los procesos, productos y API existentes de los usuarios. Ahora Claude puede orquestar funciones definidas por el desarrollador o API, buscar fuentes web y recuperar información de bases de conocimiento privadas.

La consola del desarrollador se ha simplificado para los usuarios de la API de Claude con el fin de facilitar la prueba de nuevas llamadas y acelerar la curva de aprendizaje. El nuevo Workbench permite a los desarrolladores trabajar con las llamadas en un entorno lúdico y acceder a nuevos ajustes del modelo para ajustar el comportamiento de Claude.

Vídeo: Antrópico

Claude 2.1 ya está disponible a través de la API y es compatible con la interfaz de chat en claude.ai para los planes gratuitos y pro. La ventana contextual de 200K tokens está reservada a los usuarios de Claude Pro. Claude está disponible actualmente en 95 países, pero no en la UE.

El lanzamiento hoy de Claude 2.1 podría ser un movimiento estratégico: OpenAI, el competidor de Anthropic, atraviesa una profunda crisis, y se dice que la junta directiva de OpenAI, muy criticada, incluso se ha puesto en contacto con el director general de Anthropic para hablar de una fusión. Además, se dice que más de 100 clientes de OpenAI han preguntado por la oferta de Anthropic.