CPU NVIDIA Grace Aporta Eficiencia Energética a los Data Centers

Los resultados están listos y apuntan a una nueva era en la computación de eficiencia energética.

En pruebas de cargas de trabajo reales, la CPU NVIDIA Grace Superchip obtuvo ganancias de rendimiento 2 veces superiores a los procesadores x86 con la misma envolvente de potencia en las principales aplicaciones de CPU del centro de datos. Eso abre un nuevo conjunto de oportunidades.

Significa que los centros de datos pueden manejar el doble de tráfico máximo. Pueden reducir sus facturas de energía hasta en la mitad. Pueden dar más fuerza en los espacios confinados en el edge de sus redes, o cualquier combinación de lo anterior.

Eficiencia Energética, una Prioridad del Centro de Datos

Los administradores de centros de datos necesitan estas opciones para prosperar en la era actual de eficiencia energética.

La ley de Moore está efectivamente muerta. La física ya no permite a los ingenieros empaquetar más transistores en el mismo espacio con la misma potencia.

Es por eso por lo que las nuevas CPU x86 generalmente ofrecen ganancias en comparación con las generaciones anteriores de menos del 30%. También es la razón por la cual un número creciente de centros de datos tienen un límite de energía.

Con la amenaza adicional del calentamiento global, los centros de datos no pueden darse el lujo de expandir su poder, pero aún deben responder a las crecientes demandas de computación.

Se Busca: la Misma Potencia, Más Rendimiento

La demanda de cómputo está creciendo un 10% al año en los EE. UU. y se duplicará en los ocho años entre 2022 a 2030, según un estudio de McKinsey.

“Por lo tanto, la presión para hacer que los centros de datos sean sostenibles es alta, y algunos reguladores y gobiernos están imponiendo estándares de sostenibilidad en los centros de datos recién construidos”, dijo.

Con el final de la ley de Moore, el progreso del centro de datos en la eficiencia de computación se ha estancado, según una encuesta que citó McKinsey (ver el gráfico a continuación).

En el entorno actual, las ganancias dobles ofrecidas por NVIDIA Grace son el equivalente alucinante de un salto multigeneracional. Cumple con los requisitos de los ejecutivos de centros de datos de hoy.

Zac Smith, el jefe de infraestructura en el edge de Equinix, un proveedor de servicios global que administra más de 240 centros de datos articuló estas necesidades en un artículo sobre computación de eficiencia energética.

“El rendimiento que obtienes por el impacto de carbono que tienes es hacia lo que debemos dirigirnos”, dijo.

“Tenemos 10,000 clientes que cuentan con nosotros para ayudarlos con este viaje. Exigen más datos y más inteligencia, a menudo con IA, y la quieren de manera sostenible”, agregó.

Un Trío de Innovaciones de CPU

La CPU Grace ofrece ese rendimiento eficiente gracias a tres innovaciones.

Utiliza un tejido ultrarrápido para conectar 72 núcleos Arm Neoverse V2 en un solo troquel que tiene 3,2 terabytes por segundo en ancho de banda de bisección de tejido, una medida estándar de rendimiento. Luego, conecta dos de esos troqueles en un paquete de superchip con la interconexión NVIDIA NVLink-C2C, lo que brinda 900 GB/s de ancho de banda.

Finalmente, es la primera CPU del centro de datos que usa memoria LPDDR5X de clase de servidor. Eso proporciona hasta un 50% más de ancho de banda de memoria a un costo similar, pero una octava parte de la potencia de la memoria de servidor típica. Y su tamaño compacto permite 2 veces la densidad de los diseños típicos de memoria basados en tarjetas.

En comparación con las CPU x86 actuales, NVIDIA Grace tiene un diseño más simple que ofrece más ancho de banda y usa menos energía.

Los Primeros Resultados

Los ingenieros de NVIDIA están ejecutando cargas de trabajo de centros de datos reales en Grace hoy.

Descubrieron que, en comparación con las CPU x86 líderes en centros de datos que usan la misma huella de energía, Grace es:

2,3 veces más rápido para microservicios,
2 veces más rápido en el procesamiento de datos con uso intensivo de memoria
y 1,9 veces más rápido en dinámica de fluidos computacional, utilizada en muchas aplicaciones informáticas técnicas.

Los centros de datos generalmente tienen que esperar dos o más generaciones de CPU para obtener estos beneficios, que se resumen en el cuadro a continuación.

Las ganancias netas (en verde claro) son el producto de los avances de servidor a servidor (en verde oscuro) y servidores Grace adicionales que encajan en el mismo entorno de energía x86 (barra central).

Incluso antes de estos resultados en CPU en funcionamiento, los usuarios respondieron a las innovaciones de Grace.

El Laboratorio Nacional de Los Álamos anunció en mayo que utilizará Grace en Venado, una supercomputadora de inteligencia artificial de 10 exaflop que impulsará el trabajo del laboratorio en áreas como la ciencia de los materiales y la energía renovable. Mientras tanto, los centros de datos de Europa y Asia están evaluando Grace para sus cargas de trabajo.

NVIDIA Grace está siendo probado ahora. ASUS, Atos, GIGABYTE, Hewlett Packard Enterprise, QCT, Supermicro, Wistron y ZT Systems están construyendo servidores que lo utilizan.

Profundice en la Computación Sostenible

Para profundizar en los detalles, lea este documento técnico sobre la arquitectura Grace.

Obtenga más información sobre computación sostenible en esta sesión en NVIDIA GTC (del 20 al 23 de marzo, gratis con el registro): Three Strategies to Maximize Your Organization’s Sustainability and Success in an End-to-End AI World.

Lea un documento técnico sobre la DPU NVIDIA BlueField para descubrir cómo crear redes de bajo consumo.

Y mire el discurso de apertura de GTC del fundador y CEO de NVIDIA, Jensen Huang, para tener una idea general.