Nuevas GPUs NVIDIA H100 ahora disponibles en la nube de AWS

A帽adir a tus IAs favoritasQuitar de tus favoritasQuitar de favoritos 0
Puntuaci贸n0

2023-08-18

Puntos destacados:

– 馃挕 Los usuarios de AWS ahora pueden acceder al rendimiento l铆der demostrado en benchmarks de la industria de entrenamiento e inferencia de IA.
– 馃捇 AWS ha lanzado oficialmente una nueva instancia Amazon EC2 P5 impulsada por NVIDIA H100 Tensor Core GPUs, que permite a los usuarios escalar aplicaciones de IA generativa y HPC con un solo clic.
– 馃殌 La instancia P5 de Amazon EC2 es ideal para entrenar y ejecutar inferencias para modelos de IA generativa y de visi贸n por computadora cada vez m谩s complejos. Adem谩s, se puede usar en aplicaciones que requieren altos niveles de comunicaci贸n entre nodos de computaci贸n gracias a su red no bloqueante a escala de petabit.

Los usuarios de AWS ahora pueden acceder al rendimiento l铆der demostrado en benchmarks de la industria de entrenamiento e inferencia de IA.

El gigante de la nube ha lanzado oficialmente una nueva instancia Amazon EC2 P5 impulsada por NVIDIA H100 Tensor Core GPUs. El servicio permite a los usuarios escalar aplicaciones de IA generativa, HPC y otras con un solo clic desde un navegador.

La noticia llega en medio del momento clave de la IA. Desarrolladores e investigadores est谩n utilizando modelos de lenguaje grandes (LLMs) para descubrir casi a diario nuevas aplicaciones para la IA. Para llevar estos nuevos casos de uso al mercado, se requiere la eficiencia de la computaci贸n acelerada.

La GPU NVIDIA H100 ofrece un rendimiento de supercomputadora a trav茅s de innovaciones arquitect贸nicas que incluyen Tensor Cores de cuarta generaci贸n, un nuevo motor Transformer para acelerar LLMs y la 煤ltima tecnolog铆a NVLink que permite a las GPUs comunicarse entre s铆 a 900GB/s.

Escalabilidad con instancias P5

Las instancias Amazon EC2 P5 son ideales para entrenar y ejecutar inferencias para LLMs y modelos de visi贸n por computadora cada vez m谩s complejos. Estas redes neuronales impulsan las aplicaciones de IA generativa m谩s exigentes y que requieren m谩s capacidad de c贸mputo, como la respuesta a preguntas, la generaci贸n de c贸digo, generaci贸n de video e im谩genes, reconocimiento de voz y m谩s.

Las instancias P5 se pueden implementar en cl煤steres de hiperecala llamados EC2 UltraClusters, compuestos por computaci贸n de alto rendimiento, redes y almacenamiento en la nube. Cada EC2 UltraCluster es un supercomputadora potente que permite a los clientes ejecutar sus cargas de trabajo de IA de entrenamiento m谩s complejas y distribuidas en m煤ltiples sistemas.

Para que los clientes puedan ejecutar aplicaciones a gran escala que requieren altos niveles de comunicaci贸n entre nodos de c贸mputo, la instancia P5 cuenta con redes no bloqueantes a escala de petabit, impulsadas por AWS EFA, una interfaz de red de 3,200 Gbps para instancias Amazon EC2.

Con las instancias P5, las aplicaciones de aprendizaje autom谩tico pueden utilizar la biblioteca de comunicaciones colectivas de NVIDIA para emplear hasta 20,000 GPUs H100.

NVIDIA AI Enterprise ayuda a los usuarios a aprovechar al m谩ximo las instancias P5 con un conjunto completo de software que incluye m谩s de 100 marcos, modelos preentrenados, flujos de trabajo de IA y herramientas para ajustar la infraestructura de IA.

Dise帽ado para agilizar el desarrollo e implementaci贸n de aplicaciones de IA, NVIDIA AI Enterprise aborda las complejidades de construir y mantener una plataforma de software de IA nativa de la nube, segura y de alto rendimiento. Disponible en AWS Marketplace, ofrece monitoreo continuo de seguridad, parches regulares y oportunos de vulnerabilidades y exposiciones comunes, estabilidad de API, soporte empresarial y acceso a expertos en IA de NVIDIA.

Lo que dicen los clientes

NVIDIA y AWS han colaborado durante m谩s de una docena de a帽os para llevar la aceleraci贸n de GPU a la nube. Las nuevas instancias P5, el 煤ltimo ejemplo de esa colaboraci贸n, representan un gran avance para ofrecer el rendimiento de vanguardia que permite a los desarrolladores inventar la pr贸xima generaci贸n de IA.

Estos son algunos ejemplos de lo que dicen los clientes:

Anthropic construye sistemas de IA confiables, interpretables y direccionables que tendr谩n muchas oportunidades para crear valor comercial y beneficio p煤blico.

鈥淪i bien los grandes sistemas de IA generales de hoy pueden tener beneficios significativos, tambi茅n pueden ser impredecibles, no confiables y opacos, por lo que nuestro objetivo es avanzar en estos problemas e implementar sistemas que las personas encuentren 煤tiles鈥, dijo Tom Brown, cofundador de Anthropic. 鈥淓speramos que las instancias P5 ofrezcan beneficios sustanciales en t茅rminos de rendimiento de precio en comparaci贸n con las instancias P4d, y estar谩n disponibles en la escala masiva requerida para construir LLMs de pr贸xima generaci贸n y productos relacionados鈥.

Cohere, un l铆der pionero en IA del lenguaje, permite que cada desarrollador y empresa construya productos con tecnolog铆a de procesamiento de lenguaje natural de vanguardia mientras mantiene sus datos privados y seguros.

鈥淐ohere lidera el avance al ayudar a cada empresa a aprovechar el poder de la IA del lenguaje para explorar, generar, buscar y actuar sobre informaci贸n de manera natural e intuitiva, implementando en m煤ltiples plataformas en la nube dentro del entorno de datos que mejor funcione para cada cliente鈥, dijo Aidan Gomez, CEO de Cohere. 鈥淟as instancias Amazon EC2 P5 impulsadas por NVIDIA H100 desatar谩n la capacidad de las empresas para crear, crecer y escalar m谩s r谩pido con su potencia inform谩tica combinada con las capacidades de generaci贸n de IA y LLM de vanguardia de Cohere鈥.

Por su parte, Hugging Face tiene como misi贸n democratizar el buen aprendizaje autom谩tico.

鈥淐omo la comunidad de c贸digo abierto de m谩s r谩pido crecimiento para el aprendizaje autom谩tico, ahora proporcionamos m谩s de 150,000 modelos preentrenados y 25,000 conjuntos de datos en nuestra plataforma para NLP, visi贸n por computadora, biolog铆a, aprendizaje por refuerzo y m谩s鈥, dijo Julien Chaumond, director de tecnolog铆a y cofundador de Hugging Face. 鈥淓speramos poder utilizar las instancias Amazon EC2 P5 a trav茅s de Amazon SageMaker a gran escala en UltraClusters con EFA para acelerar la entrega de nuevos modelos de IA fundamentales para todos鈥.

Hoy en d铆a, m谩s de 450 millones de personas en todo el mundo utilizan Pinterest como una plataforma de inspiraci贸n visual para comprar productos personalizados seg煤n sus gustos, encontrar ideas y descubrir creadores inspiradores.

鈥淯tilizamos el aprendizaje profundo de manera extensiva en nuestra plataforma para casos de uso como el etiquetado y categorizaci贸n de miles de millones de fotos que se cargan en nuestra plataforma y la b煤squeda visual que brinda a nuestros usuarios la capacidad de convertir la inspiraci贸n en acci贸n鈥, dijo David Chaiken, arquitecto principal de Pinterest. 鈥淓speramos poder utilizar las instancias Amazon EC2 P5 con las GPU NVIDIA H100, AWS EFA y UltraClusters para acelerar nuestro desarrollo de productos y ofrecer nuevas experiencias emp谩ticas basadas en IA a nuestros clientes鈥.

Deja una opini贸n

Deje una respuesta

馃 AI MAFIA
Logo