Las GPU NVIDIA H100 Están Disponibles en AWS Cloud

Los usuarios de AWS ahora pueden acceder al rendimiento líder demostrado en los puntos de referencia de la industria de entrenamiento e inferencia de IA.

El gigante de la nube activó oficialmente una nueva instancia P5 de Amazon EC2 con GPU NVIDIA H100 Tensor Core. El servicio permite a los usuarios escalar la IA generativa, la computación de alto rendimiento (HPC) y otras aplicaciones con un clic desde un navegador.

La noticia llega a raíz del momento iPhone de la IA. Los desarrolladores e investigadores utilizan grandes modelos de lenguaje (LLM) para descubrir nuevas aplicaciones para la IA casi a diario. Llevar estos nuevos casos de uso al mercado requiere la eficiencia de la computación acelerada.

La GPU NVIDIA H100 ofrece un rendimiento de supercomputación a través de innovaciones arquitectónicas que incluyen Nucleos Tensor de cuarta generación, un nuevo motor Transformer para acelerar los LLM y la última tecnología NVLink que permite que las GPU se comuniquen entre sí a 900 GB/s.

Escalado con Instancias P5

Las instancias P5 de Amazon EC2 son ideales para entrenar y ejecutar inferencias para LLM y modelos de visión artificial cada vez más complejos. Estas redes neuronales impulsan las aplicaciones de IA generativa más exigentes y de cálculo intensivo, como la respuesta a preguntas, la generación de código, la generación de vídeo e imágenes, el reconocimiento de voz y mucho más.

Las instancias P5 se pueden implementar en clústeres de hiperescala, denominados EC2 UltraClusters, compuestos por computación, redes y almacenamiento de alto rendimiento en la nube. Cada EC2 UltraCluster es una potente supercomputadora que permite a los clientes ejecutar sus cargas de trabajo de HPC distribuidas y de entrenamiento de IA más complejas en varios sistemas.

Para que los clientes puedan ejecutar aplicaciones a escala que requieren altos niveles de comunicaciones entre nodos de computación, la instancia P5 cuenta con redes sin bloqueo a escala de petabits, con tecnología de AWS EFA, una interfaz de red de 3 200 Gbps para instancias de Amazon EC2.

Con las instancias P5, las aplicaciones de machine learning pueden usar la NVIDIA Collective Communications Library para emplear hasta 20 000 GPU H100.

NVIDIA AI Enterprise ayuda a los usuarios a aprovechar al máximo las instancias P5 con un conjunto completo de software que incluye más de 100 marcos, modelos preentrenados, workflows de IA y herramientas para ajustar la infraestructura de IA.

Diseñado para optimizar el desarrollo y la implementación de aplicaciones de IA, NVIDIA AI Enterprise aborda las complejidades de crear y mantener una plataforma de software de IA nativa de la nube, segura y de alto rendimiento. Disponible en AWS Marketplace, ofrece monitoreo continuo de la seguridad, aplicación periódica y oportuna de vulnerabilidades y exposiciones comunes, estabilidad de la API y soporte empresarial, así como acceso a expertos en IA de NVIDIA.

Lo Que Dicen los Clientes

NVIDIA y AWS han colaborado durante más de una docena de años para llevar la aceleración de GPU a la nube. Las nuevas instancias P5, el último ejemplo de esa colaboración, representan un gran paso adelante para ofrecer el rendimiento de vanguardia que permite a los desarrolladores inventar la próxima generación de IA.

Estos son algunos ejemplos de lo que los clientes ya están diciendo:

Anthropic construye sistemas de IA fiables, interpretables y orientables que tendrán muchas oportunidades para crear valor comercialmente y para el beneficio público.

«Si bien los grandes sistemas de IA generales de hoy en día pueden tener beneficios significativos, también pueden ser impredecibles, poco confiables y opacos, por lo que nuestro objetivo es avanzar en estos temas e implementar sistemas que las personas encuentren útiles», dijo Tom Brown, cofundador de Anthropic. «Esperamos que las instancias P5 ofrezcan beneficios sustanciales de precio-rendimiento sobre las instancias P4d, y estarán disponibles a la escala masiva requerida para crear LLM de próxima generación y productos relacionados».

Cohere, pionera líder en IA lingüística, permite a todos los desarrolladores y empresas crear productos con tecnología de procesamiento del lenguaje natural (NLP) líder en el mundo, al tiempo que mantiene la privacidad y la seguridad de sus datos.

«Cohere lidera la carga para ayudar a todas las empresas a aprovechar el poder de la IA lingüística para explorar, generar, buscar y actuar sobre la información de una manera natural e intuitiva, implementándola en múltiples plataformas en la nube en el entorno de datos que mejor funcione para cada cliente», dijo Aidan Gomez, CEO de Cohere. «Las instancias P5 de Amazon EC2 con tecnología NVIDIA H100 darán rienda suelta a la capacidad de las empresas para crear, crecer y escalar más rápido con su potencia de computación combinada con las capacidades de LLM e IA generativa de última generación de Cohere».

Por su parte, Hugging Face tiene la misión de democratizar el buen machine learning.

«Como la comunidad de código abierto de más rápido crecimiento para el machine learning, ahora ofrecemos más de 150.000 modelos preentrenados y 25.000 conjuntos de datos en nuestra plataforma para NLP, visión por computadora, biología, aprendizaje por refuerzo y más», dijo Julien Chaumond, director de tecnología y cofundador de Hugging Face. «Esperamos utilizar las instancias P5 de Amazon EC2 a través de Amazon SageMaker a escala en UltraClusters con EFA para acelerar la entrega de nuevos modelos básicos de IA para todos».

Hoy en día, más de 450 millones de personas en todo el mundo utilizan Pinterest como plataforma de inspiración visual para comprar productos personalizados a su gusto, encontrar ideas y descubrir creadores inspiradores.

«Utilizamos ampliamente el deep learning en nuestra plataforma para casos de uso como etiquetar y categorizar miles de millones de fotos que se cargan en nuestra plataforma, y la búsqueda visual que brinda a nuestros usuarios la capacidad de pasar de la inspiración a la acción», dijo David Chaiken, arquitecto jefe de Pinterest. «Estamos deseando utilizar las instancias P5 de Amazon EC2 con GPU NVIDIA H100, AWS EFA y UltraClusters para acelerar el desarrollo de nuestros productos y ofrecer a nuestros clientes nuevas experiencias empáticas basadas en IA».

Obtenga más información sobre las nuevas instancias AWS P5 con tecnología NVIDIA H100.