Anthropic lanza una versión mejorada de su LLM de nivel básico

Añadir a tus IAs favoritasQuitar de tus favoritasQuitar de favoritos 0
Puntuación0

2023-08-11 18:44:10

Puntos destacados:

– 🚀 Anthropic lanza una actualización de su modelo de generación de textos, Claude Instant 1.2.

– ⚙️ Claude Instant 1.2 muestra mejoras significativas en áreas como matemáticas, codificación, razonamiento y seguridad.

– 🔒 Claude Instant 1.2 es menos propenso a la «alucinación» y más resistente a intentos de jailbreaking.

Anthropic lanza una versión actualizada de su modelo de generación de textos con Claude Instant 1.2

Anthropic lanza una version mejorada de su LLM de nivel 2023-08-11 18:44:10

Anthropic, la startup de inteligencia artificial cofundada por exejecutivos de OpenAI, ha lanzado una versión actualizada de su modelo de generación de texto más rápido y económico a través de una API, llamado Claude Instant 1.2.

Según Anthropic, Claude Instant 1.2 incorpora las fortalezas de su modelo insignia recientemente anunciado, Claude 2, y muestra mejoras «significativas» en áreas como matemáticas, codificación, razonamiento y seguridad. En pruebas internas, Claude Instant 1.2 obtuvo una puntuación del 58.7% en un referente de codificación en comparación con el 52.8% de Claude Instant 1.1, y un 86.7% en un conjunto de preguntas de matemáticas frente al 80.9% de Claude Instant 1.1.

«Claude Instant genera respuestas más largas y estructuradas y sigue mejor las instrucciones de formato», escribe Anthropic en una publicación de blog. «Instant 1.2 también muestra mejoras en la extracción de citas, capacidades multilingües y respuestas a preguntas.»

Anthropic sostiene que Claude Instant 1.2 presenta una menor propensión a la «alucinación» y es más resistente a intentos de jailbreaking. En el contexto de los modelos de lenguaje grandes como Claude, la «alucinación» ocurre cuando el modelo genera texto incorrecto o sin sentido, mientras que el jailbreaking es una técnica que utiliza indicaciones hábilmente escritas para eludir las características de seguridad implementadas en los modelos de lenguaje grandes por sus creadores.

Además, Claude Instant 1.2 tiene una ventana de contexto del mismo tamaño que Claude 2, es decir, 100,000 tokens. La ventana de contexto se refiere al texto que el modelo considera antes de generar texto adicional, mientras que los tokens representan el texto sin procesar (por ejemplo, la palabra «fantástico» se divide en los tokens «fan», «tas» y «tic»). Claude Instant 1.2 y Claude 2 pueden analizar aproximadamente 75,000 palabras, aproximadamente la longitud de «El Gran Gatsby».

En general, los modelos con ventanas de contexto grandes son menos propensos a «olvidar» el contenido de conversaciones recientes.

Como hemos informado anteriormente, la ambición de Anthropic es crear un «algoritmo de próxima generación para el autoaprendizaje de la IA», como lo describe en una presentación a los inversores. Un algoritmo así podría utilizarse para construir asistentes virtuales capaces de responder correos electrónicos, realizar investigaciones y generar arte, libros y más, algo de lo que ya hemos tenido un adelanto con modelos de lenguaje grandes como GPT-4 y otros.

Sin embargo, Claude Instant no es ese algoritmo. En su lugar, está destinado a competir con ofertas similares de nivel de entrada de OpenAI y otras startups como Cohere y AI21 Labs, todas las cuales están desarrollando y ofreciendo sus propios sistemas de IA generadores de texto (y en algunos casos, generadores de imágenes).

Hasta la fecha, Anthropic, fundada en 2021 y liderada por el ex Vicepresidente de Investigación de OpenAI, Dario Amodei, ha recaudado $1.45 mil millones con una valoración en los miles de millones. Aunque pueda sonar como una gran cantidad, está muy lejos de lo que la empresa estima que necesitará: $5 mil millones en los próximos dos años para crear su asistente virtual.

Anthropic afirma tener «miles» de clientes y socios en la actualidad, incluyendo a Quora, que ofrece acceso a Claude y Claude Instant a través de su aplicación de IA generativa basada en suscripción, Poe. Claude alimenta la herramienta DuckAssist de DuckDuckGo, lanzada recientemente, que responde directamente a consultas de búsqueda sencillas para los usuarios, en combinación con ChatGPT de OpenAI. Y en Notion, Claude forma parte de la infraestructura técnica de Notion AI, un asistente de escritura basado en IA integrado en el espacio de trabajo de Notion.

Deja una opinión

Deje una respuesta

🤖 AI MAFIA
Logo