2023-08-18
Puntos destacados:
– 💡 Los usuarios de AWS ahora pueden acceder al rendimiento líder demostrado en benchmarks de la industria de entrenamiento e inferencia de IA.
– 💻 AWS ha lanzado oficialmente una nueva instancia Amazon EC2 P5 impulsada por NVIDIA H100 Tensor Core GPUs, que permite a los usuarios escalar aplicaciones de IA generativa y HPC con un solo clic.
– 🚀 La instancia P5 de Amazon EC2 es ideal para entrenar y ejecutar inferencias para modelos de IA generativa y de visión por computadora cada vez más complejos. Además, se puede usar en aplicaciones que requieren altos niveles de comunicación entre nodos de computación gracias a su red no bloqueante a escala de petabit.
Los usuarios de AWS ahora pueden acceder al rendimiento líder demostrado en benchmarks de la industria de entrenamiento e inferencia de IA.
El gigante de la nube ha lanzado oficialmente una nueva instancia Amazon EC2 P5 impulsada por NVIDIA H100 Tensor Core GPUs. El servicio permite a los usuarios escalar aplicaciones de IA generativa, HPC y otras con un solo clic desde un navegador.
La noticia llega en medio del momento clave de la IA. Desarrolladores e investigadores están utilizando modelos de lenguaje grandes (LLMs) para descubrir casi a diario nuevas aplicaciones para la IA. Para llevar estos nuevos casos de uso al mercado, se requiere la eficiencia de la computación acelerada.
La GPU NVIDIA H100 ofrece un rendimiento de supercomputadora a través de innovaciones arquitectónicas que incluyen Tensor Cores de cuarta generación, un nuevo motor Transformer para acelerar LLMs y la última tecnología NVLink que permite a las GPUs comunicarse entre sí a 900GB/s.
Escalabilidad con instancias P5
Las instancias Amazon EC2 P5 son ideales para entrenar y ejecutar inferencias para LLMs y modelos de visión por computadora cada vez más complejos. Estas redes neuronales impulsan las aplicaciones de IA generativa más exigentes y que requieren más capacidad de cómputo, como la respuesta a preguntas, la generación de código, generación de video e imágenes, reconocimiento de voz y más.
Las instancias P5 se pueden implementar en clústeres de hiperecala llamados EC2 UltraClusters, compuestos por computación de alto rendimiento, redes y almacenamiento en la nube. Cada EC2 UltraCluster es un supercomputadora potente que permite a los clientes ejecutar sus cargas de trabajo de IA de entrenamiento más complejas y distribuidas en múltiples sistemas.
Para que los clientes puedan ejecutar aplicaciones a gran escala que requieren altos niveles de comunicación entre nodos de cómputo, la instancia P5 cuenta con redes no bloqueantes a escala de petabit, impulsadas por AWS EFA, una interfaz de red de 3,200 Gbps para instancias Amazon EC2.
Con las instancias P5, las aplicaciones de aprendizaje automático pueden utilizar la biblioteca de comunicaciones colectivas de NVIDIA para emplear hasta 20,000 GPUs H100.
NVIDIA AI Enterprise ayuda a los usuarios a aprovechar al máximo las instancias P5 con un conjunto completo de software que incluye más de 100 marcos, modelos preentrenados, flujos de trabajo de IA y herramientas para ajustar la infraestructura de IA.
Diseñado para agilizar el desarrollo e implementación de aplicaciones de IA, NVIDIA AI Enterprise aborda las complejidades de construir y mantener una plataforma de software de IA nativa de la nube, segura y de alto rendimiento. Disponible en AWS Marketplace, ofrece monitoreo continuo de seguridad, parches regulares y oportunos de vulnerabilidades y exposiciones comunes, estabilidad de API, soporte empresarial y acceso a expertos en IA de NVIDIA.
Lo que dicen los clientes
NVIDIA y AWS han colaborado durante más de una docena de años para llevar la aceleración de GPU a la nube. Las nuevas instancias P5, el último ejemplo de esa colaboración, representan un gran avance para ofrecer el rendimiento de vanguardia que permite a los desarrolladores inventar la próxima generación de IA.
Estos son algunos ejemplos de lo que dicen los clientes:
Anthropic construye sistemas de IA confiables, interpretables y direccionables que tendrán muchas oportunidades para crear valor comercial y beneficio público.
“Si bien los grandes sistemas de IA generales de hoy pueden tener beneficios significativos, también pueden ser impredecibles, no confiables y opacos, por lo que nuestro objetivo es avanzar en estos problemas e implementar sistemas que las personas encuentren útiles”, dijo Tom Brown, cofundador de Anthropic. “Esperamos que las instancias P5 ofrezcan beneficios sustanciales en términos de rendimiento de precio en comparación con las instancias P4d, y estarán disponibles en la escala masiva requerida para construir LLMs de próxima generación y productos relacionados”.
Cohere, un líder pionero en IA del lenguaje, permite que cada desarrollador y empresa construya productos con tecnología de procesamiento de lenguaje natural de vanguardia mientras mantiene sus datos privados y seguros.
“Cohere lidera el avance al ayudar a cada empresa a aprovechar el poder de la IA del lenguaje para explorar, generar, buscar y actuar sobre información de manera natural e intuitiva, implementando en múltiples plataformas en la nube dentro del entorno de datos que mejor funcione para cada cliente”, dijo Aidan Gomez, CEO de Cohere. “Las instancias Amazon EC2 P5 impulsadas por NVIDIA H100 desatarán la capacidad de las empresas para crear, crecer y escalar más rápido con su potencia informática combinada con las capacidades de generación de IA y LLM de vanguardia de Cohere”.
Por su parte, Hugging Face tiene como misión democratizar el buen aprendizaje automático.
“Como la comunidad de código abierto de más rápido crecimiento para el aprendizaje automático, ahora proporcionamos más de 150,000 modelos preentrenados y 25,000 conjuntos de datos en nuestra plataforma para NLP, visión por computadora, biología, aprendizaje por refuerzo y más”, dijo Julien Chaumond, director de tecnología y cofundador de Hugging Face. “Esperamos poder utilizar las instancias Amazon EC2 P5 a través de Amazon SageMaker a gran escala en UltraClusters con EFA para acelerar la entrega de nuevos modelos de IA fundamentales para todos”.
Hoy en día, más de 450 millones de personas en todo el mundo utilizan Pinterest como una plataforma de inspiración visual para comprar productos personalizados según sus gustos, encontrar ideas y descubrir creadores inspiradores.
“Utilizamos el aprendizaje profundo de manera extensiva en nuestra plataforma para casos de uso como el etiquetado y categorización de miles de millones de fotos que se cargan en nuestra plataforma y la búsqueda visual que brinda a nuestros usuarios la capacidad de convertir la inspiración en acción”, dijo David Chaiken, arquitecto principal de Pinterest. “Esperamos poder utilizar las instancias Amazon EC2 P5 con las GPU NVIDIA H100, AWS EFA y UltraClusters para acelerar nuestro desarrollo de productos y ofrecer nuevas experiencias empáticas basadas en IA a nuestros clientes”.