La Nueva Generación de Sistemas con la Tecnología de NVIDIA Avanza

Con el fin de la Ley de Moore, los enfoques tradicionales para satisfacer la insaciable demanda de un mayor rendimiento de computación requerirán aumentos desproporcionados en los costos y la potencia.

Al mismo tiempo, la necesidad de reducir los efectos del cambio climático requerirá data centers datos más eficientes, que ya consumen más de 200 terawatt-hora de energía cada año, o alrededor del 2% del uso de energía del mundo.

La nueva lista Green500, que se lanzó hoy, de las supercomputadoras más eficientes del mundo demuestra la eficiencia energética de la computación acelerada, que ya se usa en los 30 sistemas principales de la lista. Su impacto en la eficiencia energética es asombroso.

Estimamos que los sistemas de la lista TOP500 requieren más de 5 terawatt-hora de energía por año, equivalentes a un valor de energía de $750 millones de dólares, para funcionar.

Sin embargo, esto podría reducirse en más de un 80%, a solo 150 millones de dólares, lo que ahorraría 4 terawatt-horas de energía, si estos sistemas fueran tan eficientes como los 30 sistemas más ecológicos de la lista TOP500.

Es más, con el mismo presupuesto de energía que los sistemas de la lista TOP500 de la actualidad y la eficiencia de los 30 principales sistemas, estas supercomputadoras podrían ofrecer un rendimiento cinco veces mayor.

Y los aumentos de eficiencia destacados por los últimos sistemas Green500 son solo el comienzo. NVIDIA se está apresurando a ofrecer mejoras de energía continuas en su cartera de CPU, GPU, software y sistemas.

Debut de Hopper en la Lista Green500

Las tecnologías de NVIDIA ya impulsan a 23 de los 30 sistemas más importantes de la última lista Green500.

Entre los aspectos destacados, el Instituto Flatiron de Nueva York encabezó la lista Green500 de las supercomputadoras más eficientes con un ThinkSystem refrigerado por aire construido por Lenovo y equipado con GPU NVIDIA Pascal H100.

La supercomputadora, apodada Henri, produce 65,000 millones de operaciones de doble precisión y punto flotante por watt, según la lista Green500, y se utilizará para abordar problemas de astrofísica computacional, biología, matemáticas, neurociencia y física cuántica.

La GPU NVIDIA H100 Tensor Core, basada en la arquitectura de GPU NVIDIA Hopper, tiene hasta 6 veces más rendimiento de IA y hasta 3 veces más rendimiento de HPC en comparación con la GPU A100 de la generación anterior. Se diseñó para funcionar con una eficiencia increíble. Su tecnología de múltiples instancias de GPU de segunda generación puede dividir la GPU en unidades de computación más pequeñas, lo que aumenta enormemente la cantidad de clientes de GPU disponibles para los usuarios del data center.

La planta de exposición de la conferencia SC22 de este año está repleta de nuevos sistemas con las últimas tecnologías de NVIDIA de ASUS, Atos, Dell Technologies, GIGABYTE, Hewlett Packard Enterprise, Lenovo, QCT y Supermicro.

Leonardo, la nueva computadora más rápida de la lista TOP500, que aloja y administra el consorcio sin fines de lucro Cineca, y está impulsada por casi 14,000 GPU NVIDIA A100, se llevó el puesto n.º 4. También se mantuvo en el puesto n.º 13 en cuanto a los sistemas con mayor eficiencia energética.

La última lista TOP500 cuenta con la mayor cantidad de tecnologías de NVIDIA hasta el momento.

En total, las tecnologías de NVIDIA potencian 361 de los sistemas en la lista TOP500, incluido el 90% de los nuevos sistemas (ver gráfico).

El Data Center Acelerado de Próxima Generación

NVIDIA también está desarrollando nuevas arquitecturas de computación para ofrecer una eficiencia energética y un rendimiento aún mayores al data center acelerado.

Los Superchips Grace Hopper y de CPU Grace, anunciados a principios de este año, proporcionarán el próximo gran impulso en la eficiencia energética de la plataforma de computación acelerada de NVIDIA. El Superchip de CPU Grace ofrece hasta el doble de rendimiento por vatio que una CPU tradicional, gracias a la increíble eficacia de la CPU Grace y la memoria LPDDR5X de baja potencia.

Con un data center de HPC de 1 megawatt con el 20% de la potencia asignada para la partición de CPU y un 80% para la porción acelerada que utiliza Grace y Grace Hopper, los data centers pueden realizar 1.8 veces más trabajo para el mismo presupuesto de energía en comparación con un data center basado en x86 y particionado de manera similar.

Las DPU Impulsan Aumentos Adicionales de la Eficiencia

Junto con Grace y Grace Hopper, la tecnología de redes de NVIDIA potencia la supercomputación nativa de cloud, justo cuando el mayor uso de las simulaciones está acelerando la demanda de servicios de supercomputación.

La plataforma NVIDIA Quantum-2 InfiniBand, que se basa en la DPU NVIDIA BlueField-3, ofrece el rendimiento extremo, la accesibilidad amplia y la seguridad robusta que necesitan los proveedores de computación de cloud y los centros de supercomputación.

El esfuerzo, descrito en un reciente documento técnico, demostró cómo las DPU se pueden utilizar para descargar y acelerar las redes, la seguridad, el almacenamiento u otras funciones de infraestructura y aplicaciones de plano de control, lo que reduce el consumo de energía del servidor hasta un 30%.

La cantidad de ahorro de energía aumenta a medida que aumenta la carga del servidor y puede ahorrar fácilmente $5 millones en costos de electricidad para un gran data center con 10,000 servidores durante el ciclo de vida de tres años de los servidores, además de los ahorros adicionales en enfriamiento, entrega de energía, espacio en rack y costos de capital de servidor.

La computación acelerada con las DPU para trabajos de redes, seguridad y almacenamiento es uno de los próximos grandes pasos para hacer que los data centers sean más eficientes energéticamente.

Hacer Más con Menos

Avances como estos se logran gracias a que el método científico se está transformando rápidamente en un enfoque impulsado por el análisis de datos, la IA y la simulación basada en la física, lo que hace que las computadoras más eficientes sean clave para la próxima generación de avances científicos.

Al proporcionar a los investigadores una plataforma de computación multidisciplinar y de alto rendimiento que está optimizada para este nuevo enfoque, y capaz de lograr rendimiento y eficacia, NVIDIA les brinda a los científicos de todo el mundo un instrumento para hacer descubrimientos clave que nos beneficiarán a todos.