Data Centers de IA Seguros a Escala: El DGX SuperPOD de Próxima Generación Da Comienzo a la Era de la Supercomputación Nativa del Cloud

por Tony Paikeday

A medida que las empresas extienden el poder de la inteligencia artificial y la ciencia de datos a todos los desarrolladores, la TI debe brindar un acceso continuo y escalable a la supercomputación con una simplicidad y seguridad similares a las del cloud.

En GTC21, presentamos la última NVIDIA DGX SuperPOD, que brinda a las empresas, TI y sus usuarios una plataforma para asegurar y escalar la IA en toda la empresa, con el software necesario para administrarla, así como una experiencia de servicios especializados para ayudar a ponerla en funcionamiento.

Resolver los Desafíos de IA de Todos los Tamaños, a Gran Escala

Desde su introducción, DGX SuperPOD ha permitido a las empresas escalar su desarrollo en una infraestructura que puede abordar problemas de un tamaño y complejidad que antes no se podían resolver en un período razonable. Es una infraestructura de IA desarrollada y administrada con la metodología de NVIDIA.

A medida que la IA abarca casi todos los aspectos de los negocios modernos, la necesidad de brindar un acceso casi ilimitado a los recursos computacionales que impulsan el desarrollo ha aumentado exponencialmente. Este aumento de la demanda se ejemplifica mediante aplicaciones críticas para el negocio como el procesamiento de idiomas naturales, los sistemas de recomendación y la investigación clínica.

Las organizaciones a menudo aprovechan el poder de DGX SuperPOD de dos maneras. Algunas lo usan para resolver enormes problemas monolíticos, como la IA conversacional, donde se aplica el poder computacional de un DGX SuperPOD completo para acelerar el entrenamiento de complejos modelos de procesamiento de idiomas naturales.

Otras utilizan DGX SuperPOD para dar servicio a toda una empresa, ya que proporcioan acceso a múltiples equipos al sistema para respaldar las necesidades fluctuantes en una amplia variedad de proyectos. En este modo, la TI empresarial a menudo actúa como un proveedor de servicios, administrando esta infraestructura de inteligencia artificial como servicio, con múltiples usuarios (quizás incluso adversarios) que necesitan y esperan un aislamiento completo del trabajo y los datos de los demás.

DGX SuperPOD con DPU BlueField

Cada vez más, las empresas necesitan llevar el mundo de la supercomputación de inteligencia artificial de alto rendimiento a un modo operativo en el que muchos desarrolladores puedan estar seguros de que su trabajo es seguro y aislado como en el cloud. Y donde TI puede administrar el entorno de manera muy similar a una instancia de cloud privada, con la capacidad de entregar recursos a los trabajos, del tamaño adecuado para la tarea, en un entorno seguro de múltiples clientes.

Esto se denomina supercomputación nativa del cloud y está habilitado por las DPU NVIDIA BlueField-2, que brindan servicios de gestión, seguridad, almacenamiento y redes de data centers definidos por software y acelerados a la infraestructura de IA.

Con una unidad de procesamiento de datos optimizada para la implementación empresarial y conectividad de red de 200 Gbps, las empresas obtienen redes de vanguardia, aceleradas y totalmente programables que implementan seguridad de confianza cero para proteger contra infracciones y aislar a los usuarios y los datos, con un rendimiento como el de un entorno bare metal.

Cada DGX SuperPOD ahora tiene esta capacidad con la integración de dos DPU NVIDIA BlueField-2 en cada nodo DGX A100 dentro de él. Los administradores de TI pueden utilizar las capacidades de descarga, aceleración y aislamiento de las DPU NVIDIA BlueField para implementar clientes múltiples seguros en la infraestructura de IA compartida sin afectar el rendimiento de IA del DGX SuperPOD.

Gestión de la Infraestructura con Base Command Manager

Cada semana, NVIDIA gestiona miles de cargas de trabajo de IA ejecutadas en nuestra infraestructura interna DGX SATURNV, que incluye más de 2000 sistemas DGX. Hasta la fecha, hemos ejecutado más de 1.2 millones de trabajos en él, para respaldar a más de 2500 desarrolladores en más de 200 equipos. También hemos estado desarrollando un software de gestión de infraestructura de vanguardia que garantiza que todos los desarrolladores de NVIDIA sean totalmente productivos mientras realizan sus investigaciones y desarrollan nuestra tecnología de sistemas autónomos, robótica, simulaciones y más.

El software respalda todo este trabajo, simplifica y agiliza la administración y permite a nuestro equipo de TI monitorear el estado, la utilización, el rendimiento y más. Estamos agregando este mismo software, llamado NVIDIA Base Command Manager, a DGX SuperPOD para que las empresas puedan ejecutar sus entornos de la forma en que lo hacemos. Mejoraremos continuamente Base Command Manager, a fin de entregar las últimas innovaciones a los clientes de forma automática.

Servicios Especializados

La implementación de la infraestructura de IA es más que simplemente instalar servidores y almacenamiento en racks de data centers. Cuando una empresa decide escalar la IA, necesita una experiencia práctica que la guíe desde el diseño hasta la implementación y la operacionalización, sin sobrecargar a su equipo de TI para descubrir cómo ejecutarla, una vez que se entregan las “claves”.

Con DGX SuperPOD White Glove Services, los clientes disfrutan de una experiencia de servicios en todo el ciclo de vida respaldada por una experiencia probada desde la instalación hasta las operaciones. Los clientes se benefician del rendimiento previo a la entrega certificado en el propio clúster de aceptación de NVIDIA, que valida que el sistema implementado se esté ejecutando según las especificaciones antes de entregarlo.

Los servicios de White Glove también incluyen un equipo NVIDIA multidisciplinario dedicado que cubre todo, desde la instalación hasta la administración de la infraestructura y el workflow para abordar los obstáculos y las optimizaciones que afectan el rendimiento. Los servicios están diseñados para brindar a los líderes de TI tranquilidad y confianza mientras confían su negocio a DGX SuperPOD.

DGX SuperPOD en GTC21

Para obtener más información sobre DGX SuperPOD y cómo puede consolidar la infraestructura de IA y centralizar el desarrollo en toda tu empresa, consulta nuestra sesión presentada por Charlie Boyle, vicepresidente y gerente general de DGX Systems, quien hablará sobre nuestras noticias relacionadas con DGX SuperPOD y más en dos sesiones de GTC:

Más información: