Diseñar, simular y poner en marcha data centers modernos es increíblemente complejo, e implica múltiples consideraciones como el rendimiento, la eficiencia energética y la escalabilidad.
También requiere reunir a un equipo de ingenieros altamente cualificados en el diseño de redes y computación, el modelado de diseño asistido por ordenador (CAD) y el diseño mecánico, eléctrico y térmico.
NVIDIA construye las supercomputadoras de IA más avanzadas del mundo y en GTC presentó su último evento: un gran clúster basado en el sistema de refrigeración líquida NVIDIA GB200 NVL72. Consta de dos racks, cada uno de los cuales contiene 18 CPU NVIDIA Grace y 36 GPU NVIDIA Blackwell, conectados por conmutadores NVIDIA NVLink de cuarta generación.
En la sala de exhibición, NVIDIA hizo una demostración de este data center totalmente operativo como un gemelo digital en NVIDIA Omniverse, una plataforma para conectar y crear canalizaciones, herramientas, aplicaciones y servicios 3D habilitados para IA generativa.
Para poner en marcha nuevos data centers lo más rápido posible, NVIDIA primero construyó su gemelo digital con herramientas de software conectadas por Omniverse. Los ingenieros unificaron y visualizaron múltiples conjuntos de datos CAD con total precisión física y fotorrealismo en Universal Scene Description (OpenUSD) utilizando la plataforma de gemelos digitales Cadence Reality, impulsada por las API de NVIDIA Omniverse.
Diseñe, Simule y Optimice con Mayor Eficiencia y Precisión
El nuevo clúster GB200 está reemplazando un clúster existente en uno de los centros de datos heredados de NVIDIA. Para iniciar la construcción digital, la empresa de tecnología Kinetic Vision escaneó las instalaciones utilizando el escáner lidar portátil NavVis VLX para producir datos de nubes de puntos y fotos panorámicas de alta precisión.
A continuación, se utilizó el software Prevu3D para eliminar los clústeres existentes y convertir la nube de puntos en una malla 3D. Esto proporcionó un modelo 3D físicamente preciso de la instalación, en el que se pudo simular el nuevo data center digital.
Los ingenieros combinaron y visualizaron múltiples conjuntos de datos CAD con mayor precisión y realismo mediante el uso de la plataforma Cadence Reality. La integración de la plataforma con Omniverse proporcionó una potente plataforma de computación que permitió a los equipos desarrollar herramientas, workflows y aplicaciones 3D basados en OpenUSD.
Las API de Omniverse Cloud también agregaron interoperabilidad con más herramientas, incluidas PATCH MANAGER y NVIDIA Air. Con PATCH MANAGER, el equipo diseñó el diseño físico de su clúster y su infraestructura de red, lo que garantizó que las longitudes de cableado fueran precisas y que el enrutamiento estuviera configurado correctamente.
El equipo utilizó los solucionadores Reality Digital Twin de Cadence, acelerados por las API de NVIDIA Modulus y NVIDIA Grace Hopper, para simular los flujos de aire, así como el rendimiento de los nuevos sistemas de refrigeración líquida de socios como Vertiv y Schneider Electric. Los sistemas de refrigeración integrados en las bandejas GB200 se simularon y optimizaron utilizando soluciones de Ansys, que llevaron los datos de simulación al gemelo digital.
La demostración mostró cómo los gemelos digitales pueden permitir a los usuarios probar, optimizar y validar completamente los diseños de los data centers antes de producir un sistema físico. Al visualizar el rendimiento del data center en el gemelo digital, los equipos pueden optimizar mejor sus diseños y planificar escenarios hipotéticos.
Los usuarios también pueden mejorar los diseños de data centers y clústeres equilibrando conjuntos dispares de condiciones límite, como longitudes de cableado, alimentación, refrigeración y espacio, de manera integrada, lo que permite a los ingenieros y equipos de diseño poner en línea los clústeres mucho más rápido y con más eficiencia y optimización que antes.
Obtén más información sobre los sistemas NVIDIA GB200 NVL72 y NVIDIA Omniverse.