La GPU para IA más poderosa del mundo, la GPU NVIDIA H100 Tensor Core, ahora está disponible en una gama de nuevos productos y servicios, lo que ayuda a abordar la creciente demanda de capacitación e inferencia de IA generativa.
Microsoft Azure y muchos otros proveedores de la nube ahora ofrecen instancias H100. Las supercomputadoras de IA NVIDIA DGX H100 están en plena producción y pronto llegarán a empresas de todo el mundo.
Y Meta lanzó para uso interno una primera versión de su plataforma Grand Teton, una supercomputadora de IA basada en H100 anunciada en octubre en la Cumbre Global OCP de 2022. A finales de este año, Meta planea hacer de Grand Teton una plataforma de disponibilidad general para Open Compute Project (OCP).
Scott Guthrie, vicepresidente ejecutivo del grupo Cloud+AI de Microsoft, dijo: “La IA está cambiando la forma en que cada empresa opera y tiene éxito a medida que su adopción continúa acelerándose. La arquitectura Hopper de NVIDIA está brindando un rendimiento de computación, una escala y una funcionalidad sin precedentes a un número creciente de empresas que innovan con Microsoft Azure”.
La Arquitectura Hopper Acelera la IA
El H100, basado en la última arquitectura de computación GPU Hopper de NVIDIA con Transformer Engines integrados, está optimizado para desarrollar, entrenar e implementar IA generativa, modelos de lenguaje extenso (LLM) y sistemas de recomendación. Esta tecnología utiliza la precisión FP8 de H100 y ofrece un entrenamiento de IA 9 veces más rápido y una inferencia de IA hasta 30 veces más rápida en LLM en comparación con la generación anterior de A100. El H100 comenzó a enviarse en otoño en unidades de placa individuales y seleccionadas de fabricantes globales.
NVIDIA DGX H100 cuenta con ocho GPU H100 conectadas con interconexiones de alta velocidad NVIDIA NVLink y redes NVIDIA Quantum InfiniBand y Spectrum Ethernet integradas. Esta plataforma proporciona 32 petaflops de rendimiento de computación con precisión FP8, con redes 2 veces más rápidas que la generación DGX A100 anterior, lo que ayuda a maximizar la eficiencia energética en el procesamiento de grandes cargas de trabajo de IA.
DGX H100 también cuenta con el paquete completo de software NVIDIA AI, lo que permite a las empresas ejecutar y administrar sin problemas sus cargas de trabajo de IA a escala. Esta oferta incluye la última versión de NVIDIA AI Enterprise, anunciada por separado hoy, así como NVIDIA Base Command, el sistema operativo del centro de datos DGX, que coordina el entrenamiento y las operaciones de IA en toda la plataforma NVIDIA DGX para simplificar y agilizar el desarrollo de IA.
Primeros Usuarios que Impulsan la Innovación de IA en Todo el Mundo
Entre los primeros en usar GPU H100 en la nube se encuentra Anlatan, que proporciona una aplicación de suscripción paga, NovelAI para la escritura de historias asistida por IA y la síntesis de texto a imagen y un cliente del socio de nube de NVIDIA CoreWeave.
“Estamos completamente enfocados en la innovación de IA y los primeros productos de IA”, dijo el CEO de Anlatan, Eren Doğan. “Las GPU NVIDIA H100 son aceleradores de machine learning de última generación, lo que nos brinda una ventaja competitiva significativa dentro de la industria del machine learning para una amplia variedad de aplicaciones, desde el entrenamiento de modelos hasta la inferencia de modelos”.
Entre los líderes de la industria que recibieron la primera ola de sistemas DGX H100 se encuentran:
- Mitsui, uno de los principales grupos empresariales de Japón, que diversifica y desarrolla una amplia variedad de negocios en campos como la energía, el bienestar, la TI y la comunicación, está construyendo la primera supercomputadora de IA generativa del mundo para el descubrimiento de fármacos, con tecnología DGX H100.
- El Laboratorio de Física Aplicada de la Universidad Johns Hopkins, el centro de investigación afiliado a una universidad más grande del país utilizará DGX H100 para capacitar a los LLM.
- KTH Royal Institute of Technology, una universidad técnica y de ingeniería líder en Europa con sede en Estocolmo, utilizará DGX H100 para ofrecer programas de computación de última generación para la educación superior.
- Telconet, un proveedor de telecomunicaciones líder en Ecuador, está creando análisis de video inteligente para ciudades seguras y servicios lingüísticos para ayudar a los clientes en todos los dialectos del español.
- CyberAgent, una empresa líder en publicidad digital y servicios de Internet con sede en Japón, está creando anuncios digitales producidos por IA y avatares de gemelos digitales de celebridades, utilizando tecnologías generativas de IA y LLM.
Disponibilidad
Las supercomputadoras NVIDIA DGX H100 están en plena producción y pronto estarán disponibles a través de los socios de NVIDIA en todo el mundo. Los clientes pueden probar DGX H100 hoy con NVIDIA DGX Cloud. Los precios están disponibles a través de los socios de NVIDIA DGX en todo el mundo.
NVIDIA H100 en la nube está disponible en Microsoft Azure en versión preliminar privada. Cirrascale y CoreWeave han anunciado la disponibilidad general de las instancias H100. Los socios de nube adicionales que planean ofrecer H100 incluyen AWS, Google Cloud, Oracle Cloud Infrastructure, Lambda, Paperspace y Vultr.
Los precios y otros detalles están disponibles directamente de los socios de la nube de NVIDIA.
Mira a Huang hablar sobre la arquitectura NVIDIA Hopper en su discurso de apertura de GTC.