NVIDIA Agrega GPU con Enfriamiento Líquido para una Computación Sustentable y Eficiente

Una GPU NVIDIA A100 PCIe con enfriamiento líquido es el primer modelo de una línea de GPU para servidores convencionales que responde a la demanda de los clientes en relación con data centers verdes de alto rendimiento.
por Joe Delaere

A fin de colaborar con el esfuerzo mundial para detener el cambio climático, Zac Smith forma parte de un movimiento creciente para construir data centers que brinden alto rendimiento y eficiencia energética.

Es el jefe de infraestructura de edge de Equinix, un proveedor de servicios global que administra más de 240 data centers y se compromete a convertirse en el primero de su sector en generar un efecto neutro para el clima.

«Tenemos 10,000 clientes que cuentan con nosotros para obtener ayuda en este proceso. Exigen más datos y más inteligencia, a menudo con IA, y lo quieren de una manera sustentable», dijo Smith.

Lograr el Progreso en la Eficiencia

Hasta abril, Equinix emitió 4,900 millones de dólares en bonos verdes. Son instrumentos de nivel de inversión que Equinix aplicará para reducir el impacto ambiental mediante la optimización de la eficacia del uso de energía (PUE), una métrica de la industria sobre la cantidad de la energía utilizada por un data center que se destina directamente a las tareas de computación.

Los operadores de data centers intentan llevar esa proporción cada vez más cerca del ideal de 1.0 PUE.  Las instalaciones de Equinix tienen un promedio de 1.48 PUE en la actualidad. Sus mejores data centers nuevos logran menos de 1.2.

Equinix drives data center efficiency with liquid cooled GPUs
Equinix está logrando un progreso constante en la eficiencia energética de sus data centers según las mediciones de PUE (inset).

En otro paso hacia adelante, Equinix abrió en enero una instalación dedicada a buscar avances en la eficiencia energética. Una parte de ese trabajo se centra en el enfriamiento líquido.

El enfriamiento líquido, nacida en la era del mainframe, está madurando en la era de la IA. Ahora se usa ampliamente en las supercomputadoras más rápidas del mundo, en una forma moderna llamada enfriamiento de chip directo.

La refrigeración líquida es el siguiente paso en la computación acelerada para las GPUs refrigeradas por aire de NVIDIA, que ya ofrecen hasta 20 veces más eficiencia energética en trabajos de inferencia de IA y computación de alto rendimiento que las CPUs.

Eficiencia por Aceleración

Si cambiaras todos los servidores solo de CPU que ejecutan IA en todo el mundo a sistemas acelerados por GPU, podrías ahorrar nada menos que 11 billones de vatios-hora de energía al año. Eso es como ahorrar la energía que consumen 1.5 millones de hogares en un año.

Hoy, NVIDIA aumenta sus esfuerzos de sostenibilidad con el lanzamiento de la primera GPU PCIe para centros de datos que utiliza refrigeración directa del chip.

Equinix califica la GPU A100 80GB PCIe con enfriamiento líquido para su uso en sus data centers a finales de este año como parte de un enfoque integral para lograr el enfriamiento sostenible y la captura de calor. Las GPU ya están disponibles como muestras y estarán disponibles de forma general este verano.

Ahorrar Agua y Energía

«Esta es la primera GPU con enfriamiento líquido que se presentó en nuestro laboratorio. Esto es emocionante para nosotros porque nuestros clientes buscan formas sustentables de aprovechar la IA», dijo Smith.

El objetivo de los operadores de data centers es eliminar las refrigeradoras que evaporan millones de galones de agua al año para enfriar el aire dentro de los data centers. El enfriamiento líquido promete sistemas que reciclen pequeñas cantidades de fluidos en sistemas cerrados y que estén centrados en los puntos calientes clave.

«Convertiremos un desperdicio en un recurso», dijo.

Mismo Rendimiento, Menos Energía

En pruebas separadas, tanto Equinix como NVIDIA descubrieron que un data center que usaba enfriamiento líquido podía ejecutar las mismas cargas de trabajo que una instalación de enfriamiento por aire con un 30% menos de energía. NVIDIA estima que el data center con enfriamiento líquido podría llegar a 1.15 PUE, muy por debajo del valor de 1.6 para su par con enfriamiento por aire.

Los data centers con enfriamiento líquido también pueden lograr el doble de computación en el mismo espacio. Esto se debe a que las GPU A100 usan solo una ranura PCIe; Las GPU A100 con enfriamiento por aire necesitan dos.

NVIDIA drives efficiency with liquid cooled GPUs
NVIDIA nota un ahorro de energía y ganancias de densidad con el enfriamiento líquido.

Al menos una docena de fabricantes de sistemas planean incorporar estas GPU a sus ofertas a finales de este año. Entre ellos se encuentran ASUS, ASRock Rack, Foxconn Industrial Internet, GIGABYTE, H3C, Inspur, Inventec, Nettrix, QCT, Supermicro, Wiwynn y xFusion.

Una Tendencia Global

Las regulaciones que establecen normas de eficiencia energética están pendientes en Asia, Europa y los Estados Unidos. Eso también motiva a los bancos y otros grandes operadores de data centers a evaluar el enfriamiento líquido.

Además, la tecnología no se limita a los data centers. Los automóviles y otros sistemas la necesitan para enfriar los sistemas de alto rendimiento integrados dentro de espacios confinados.

El Camino hacia la Sustentabilidad

«Este es el comienzo de un viaje», dijo Smith sobre el debut de los aceleradores convencionales con enfriamiento líquido.

De hecho, lanzaremos una nueva versión de la tarjeta A100 PCIe el próximo año utilizando la GPU H100 Tensor Core basada en la arquitectura NVIDIA Hopper. Planeamos respaldar el enfriamiento líquido en nuestras GPU para data centers de alto rendimiento y nuestras plataformas NVIDIA HGX para el futuro predecible.

A fin de acelerar la adopción, las GPU actuales con enfriamiento líquido ofrecen el mismo rendimiento con menos energía. En el futuro, esperamos que estas tarjetas ofrezcan una opción para obtener más rendimiento con la misma energía, algo que los usuarios dicen que quieren.

«La medición de vatios por sí sola no es relevante, el rendimiento que obtienes para el impacto de carbono que logras tiene que ser nuestro objetivo», dijo Smith.

Obtén más información sobre nuestras nuevas GPU A100 PCIe con enfriamiento líquido aquí.