El CEO de NVIDIA Presenta las GPU RTX de Próxima Generación y los Workflows de IA en el Cloud

Los nuevos servicios de cloud para admitir los workflows de IA y el lanzamiento de una nueva generación de GPU GeForce RTX se anunciaron hoy en el discurso destacado de GTC a cargo del CEO de NVIDIA, Jensen Huang. El discurso estuvo repleto de nuevos sistemas, silicio y software.

«La computación avanza a velocidades increíbles, el motor que impulsa este cohete es la computación acelerada y su combustible es la inteligencia artificial», dijo Huang durante una presentación virtual cuando dio comienzo al evento NVIDIA GTC.

Una y otra vez, Huang conectó nuevas tecnologías a nuevos productos y nuevas oportunidades: desde aprovechar la IA para deleitar a los jugadores con gráficos nunca antes vistos hasta construir terrenos de pruebas virtuales donde las empresas más grandes del mundo puedan refinar sus productos.

Impulsar el auge de nuevas ideas, nuevos productos y nuevas aplicaciones: una visión singular de la computación acelerada que desbloquea avances en la IA, que, a su vez, tocará industrias de todo el mundo.

Los jugadores y los creadores obtendrán las primeras GPU basadas en la nueva arquitectura NVIDIA Ada Lovelace.

Las empresas obtendrán nuevas y potentes herramientas para aplicaciones de computación de alto rendimiento con sistemas basados en la CPU Grace y el superchip Grace Hopper. Aquellos que desarrollan la Internet 3D obtendrán nuevos servidores OVX impulsados por las GPU Ada Lovelace L40 para data centers. Los investigadores y científicos de computación obtienen nuevas y grandes capacidades de modelos de idiomas con NVIDIA LLM NeMo Service. Y la industria automotriz obtiene Thor, un nuevo cerebro con un increíble rendimiento de 2000 teraflops.

Huang destacó la forma en que las tecnologías de NVIDIA funcionan gracias a un gran número de socios y clientes importantes en diferentes industrias.

Para acelerar la adopción, anunció que Deloitte, la firma de servicios profesionales más grande del mundo, está brindando nuevos servicios basados en la IA de NVIDIA y NVIDIA Omniverse a las empresas del mundo.

Además, compartió historias de clientes del gigante de las telecomunicaciones Charter, así como de General Motors en la industria automotriz, el sistema de ferrocarril alemán Deutsche Bahn en el transporte, The Broad Institute en la investigación médica y Lowe’s en la venta minorista.

NVIDIA GTC, que comenzó esta semana, se ha convertido en una de las reuniones de IA más importantes del mundo, con más de 200 oradores de empresas como Boeing, Deutsche Bank, Lowe’s, Polestar, Johnson & Johnson, Kroger, Mercedes-Benz, Siemens AG, T-Mobile y US Bank. Más de 200,000 personas se han registrado en la conferencia.

Un «salto cuántico»: GPU GeForce RTX Serie 40

El primero de los bloques en el discurso destacado fue el lanzamiento de las GPU GeForce RTX Serie 40 de próxima generación con la tecnología de Ada, lo que Huang llamó un «salto cuántico» que allana el camino para los creadores de mundos totalmente simulados.

El CEO de NVIDIA, Jensen Huang, lanzó las GPU GeForce RTX Serie 40 de próxima generación.

Huang le dio a su público una muestra de lo que es posible al ofrecer una mirada a Racer RTX, una simulación totalmente interactiva completamente creada con ray tracing, con toda la acción modelada físicamente.

Los avances de Ada incluyen un nuevo multiprocesador de transmisión, un nuevo Núcleo RT con el doble de rendimiento de intersección de triángulo-rayos, y un nuevo Núcleo Tensor con el motor Hopper FP8 Transformer y 1.4 petaflops de potencia de procesador Tensor.

Ada también presenta la última versión de la tecnología NVIDIA DLSS, DLSS 3, que utiliza IA para generar nuevos cuadros comparando estos nuevos cuadros con cuadros anteriores para comprender cómo está cambiando una escena. El resultado: aumenta el rendimiento del juego hasta 4 veces en comparación con la renderización de fuerza bruta.

DLSS 3 es compatible con muchos de los desarrolladores de juegos más importantes del mundo. Además, se anunciaron más de 35 juegos y aplicaciones. «DLSS 3 es uno de nuestros mejores inventos de renderización neuronal», dijo Huang.

Juntos, dijo Huang, estas innovaciones ayudan a ofrecer un rendimiento de procesamiento 4 veces más alto con la nueva GeForce RTX 4090 en comparación con su precursora, la RTX 3090 Ti. El precio inicial del «nuevo campeón de peso pesado» es de $1.599 y estará disponible a partir del 12 de octubre.

Además, la nueva GeForce RTX 4080 se lanzará con noviembre dos configuraciones.

La GeForce RTX 4080 de 16 GB, a un precio de $1199, tiene 9.728 núcleos CUDA y 16 GB de memoria Micron GDDR6X de alta velocidad. Con DLSS 3, es el doble de rápida en los juegos actuales que la GeForce RTX 3080 Ti y es más potente que la GeForce RTX 3090 Ti con una menor cantidad de energía.

La GeForce RTX 4080 de 12 GB tiene 7680 núcleos CUDA y 12 GB de memoria Micron GDDR6X, y con DLSS 3 es más rápida que la RTX 3090 Ti, la GPU emblema de la generación anterior. Tiene un precio de $899.

Huang también anunció que NVIDIA Lightspeed Studios utilizó Omniverse para reinventar Portal, uno de los juegos más celebrados de la historia. Con NVIDIA RTX Remix, un conjunto de herramientas asistido por IA, los usuarios pueden modificar sus juegos favoritos, lo que les permite mejorar las texturas y los recursos, y brindarles a los materiales propiedades físicamente precisas.

Impulsar los Avances de IA, la GPU H100 en Producción Completa

Para unir una vez más sistemas y software con amplias tendencias tecnológicas, Huang explicó que los modelos de idiomas grandes, o LLM, y los sistemas de recomendación son los dos modelos de IA más importantes en la actualidad.

Los recomendadores «administran la economía digital», ya que impulsan todo, desde el comercio electrónico hasta el entretenimiento y la publicidad, dijo. «Son los motores detrás de las redes sociales, la publicidad digital, el comercio electrónico y la búsqueda».

Además, los grandes modelos de idiomas basados en el modelo de deep learning Transformer, que se lanzó por primera vez en 2017, ahora se encuentran en las áreas más emocionantes para la investigación en IA, y pueden aprender a comprender el lenguaje humano sin supervisión ni conjuntos de datos etiquetados.

«Un solo modelo previamente entrenado puede realizar múltiples tareas, como responder preguntas, resumir documentos, generación de texto, traducción e incluso programación de software», dijo Huang.

Para potenciar estos enormes modelos, Huang dijo que la GPU NVIDIA H100 con núcleos Tensor, con el motor Transformer de próxima generación de Hopper, está en plena producción y los sistemas se distribuirán en las próximas semanas.

«Hopper está en plena producción y pronto se lanzará para potenciar las fábricas de inteligencia artificial del mundo», dijo Huang.

Los socios que desarrollan sistemas incluyen Atos, Cisco, Dell Technologies, Fujitsu, GIGABYTE, Hewlett Packard Enterprise, Lenovo y Supermicro. Además, Amazon Web Services, Google Cloud, Microsoft Azure y Oracle Cloud Infrastructure serán las primeras empresas en implementar instancias basadas en H100 en el cloud a partir del próximo año.

Grace Hopper, que combina la CPU del data center Grace basada en Arm de NVIDIA con las GPU Hopper, con un aumento de 7 veces en la capacidad de memoria rápida, dará un «salto gigantesco» para los sistemas de recomendación, dijo Huang. Los sistemas que incorporan Grace Hopper estarán disponibles en el primer semestre de 2023.

Unir el Metaverso y las GPU L40 para Data Centers en Plena Producción

La próxima evolución de Internet, llamada metaverso, se extenderá con 3D, explicó Huang. Omniverse es la plataforma de NVIDIA para crear y ejecutar aplicaciones de metaverso.

Aquí también, Huang explicó cómo conectar y simular estos mundos requerirá nuevas computadoras potentes y flexibles. Además, los servidores NVIDIA OVX se diseñaron para escalar las aplicaciones de metaverso.

Los sistemas OVX de 2.ª generación de NVIDIA estarán impulsados por las GPU para data centers Ada Lovelace L40, que ahora están en plena producción, anunció Huang.

Thor para Vehículos Autónomos, Robótica, Instrumentos Médicos y Más

En los vehículos de hoy en día, la seguridad activa, el estacionamiento, el monitoreo del conductor, los espejos de cámara, el clúster y el infoentretenimiento son impulsados por diferentes computadoras. En el futuro, se entregarán mediante software que mejora con el tiempo y se ejecuta en una computadora centralizada, dijo Huang.

Para impulsar esto, Huang presentó DRIVE Thor, que combina el motor transformer de Hopper, la GPU de Ada y la increíble CPU de Grace.

El nuevo superchip Thor ofrece 2,000 teraflops de rendimiento, para reemplazar a Atlan en la hoja de ruta de DRIVE y proporcionar una transición perfecta de DRIVE Orin, que tiene 254 TOPS de rendimiento y está actualmente en producción para vehículos. Thor será el procesador para la robótica, los instrumentos médicos, la automatización industrial y los sistemas de IA en el edge, dijo Huang.

3.5 Millones de Desarrolladores, 3,000 Aplicaciones Aceleradas

Huang anunció que brindar los sistemas y el silicio de NVIDIA, y los beneficios de la computación acelerada, a industrias de todo el mundo, es un ecosistema de software con más de 3.5 millones de desarrolladores que crean unas 3,000 aplicaciones aceleradas utilizando los 550 conjuntos de desarrollo de software o SDK de NVIDIA y modelos de IA.

Y está creciendo rápidamente. En los últimos 12 meses, NVIDIA ha actualizado más de 100 SDK e introducido 25 nuevos.

«Los nuevos SDK aumentan la capacidad y el rendimiento de los sistemas que poseen nuestros clientes, al tiempo que abren nuevos mercados para la computación acelerada», dijo Huang.

Nuevas Servicios para AI, Mundos Virtuales

Los modelos de idiomas grandes «son los modelos de IA más importantes en la actualidad», dijo Huang. Basados en la arquitectura transformer, estos modelos gigantes pueden aprender a comprender significados e idiomas sin supervisión ni conjuntos de datos etiquetados, lo que desbloquea nuevas y notables capacidades.

Para facilitar a los investigadores aplicar esta tecnología «increíble» a su trabajo, Huang anunció el servicio Nemo LLM, un servicio de cloud administrado por NVIDIA para adaptar los LLM previamente entrenados y realizar tareas específicas.

Para acelerar el trabajo de los investigadores de fármacos y biociencias, Huang también presentó BioNeMo LLM, un servicio para crear LLM que entienden las secuencias de sustancias químicas, proteínas, ADN y ARN.

Huang anunció que NVIDIA está trabajando con el Instituto Broad, el mayor productor mundial de información genómica humana, para que las bibliotecas NVIDIA Clara, como NVIDIA Parabricks, el Kit de Herramientas de Análisis Genómico y BioNeMo, estén disponibles en la Plataforma Terra Cloud de Broad.

NVIDIA está trabajando con el Instituto Broad, el mayor productor mundial de información genómica humana, para que las bibliotecas NVIDIA Clara estén disponibles en la plataforma Terra Cloud de Broad.

Huang también mencionó NVIDIA Omniverse™ Cloud, una infraestructura como servicio que conecta aplicaciones de Omniverse que se ejecutan en el cloud, las instalaciones o dispositivos.

Huang anunció que los nuevos contenedores de Omniverse (Replicator para la generación de datos sintéticos, Farm para escalar granjas de renderización e Isaac Sim para desarrollar y entrenar robots de IA) ahora están disponibles para la implementación en el cloud.

Omniverse está viendo una amplia adopción, y Huang compartió varias historias y demostraciones de clientes:

Lowe’s, que tiene casi 2,000 tiendas de venta minorista, está utilizando Omniverse para diseñar, construir y operar digital twins de sus tiendas.
Charter, un proveedor de telecomunicaciones de 50,000 millones de dólares y el proveedor de análisis de datos interactivo HeavyAI, están utilizando Omniverse para crear digital twins de las redes 4G y 5G de Charter.
GM está creando un digital twin de su Michigan Design Studio en Omniverse, donde los diseñadores, ingenieros y vendedores pueden colaborar.

Lowe’s, un vendedor minorista de mejoras en el hogar, está utilizando Omniverse para diseñar, construir y operar digital twins de sus tiendas.

Nuevo Jetson Orin Nano para la Robótica

Al pasar de mundos virtuales a máquinas que se moverán por su mundo, las computadoras robóticas «son los tipos de computadoras más nuevos», dijo Huang, que describió describiendo el procesador de segunda generación de NVIDIA para robótica, Orin, como un enorme avance.

Para llevar Orin a más mercados, anunció el Jetson Orin Nano, una pequeña computadora robótica que es 80 veces más rápida que la popular Jetson Nano anterior.

Jetson Orin Nano ejecuta la pila de robótica NVIDIA Isaac y cuenta con el framework ROS 2 acelerado por GPU, y NVIDIA Iaaac Sim, una plataforma de simulación robótica, y está disponible en el cloud.

Y para los desarrolladores de robótica que usan AWS RoboMaker, Huang anunció que los contenedores para la plataforma NVIDIA Isaac para el desarrollo de robótica se encuentran en el mercado de AWS.

Nuevas Herramientas para Video y Servicios de Imágenes

La mayor parte del tráfico de Internet del mundo es video, y las transmisiones de video generadas por los usuarios se verán cada vez más aumentadas por los efectos especiales de IA y los gráficos por computación, explicó Huang.

«Los avatares harán la visión de computación, la IA de habla, la comprensión de idiomas y los gráficos por computación en tiempo real y a escala de cloud», dijo Huang.

Para permitir nuevas innovaciones en la intersección de posibles gráficos, IA y comunicaciones en tiempo real, Huang anunció que NVIDIA ha desarrollado bibliotecas de aceleración como CV-CUDA, un motor de tiempo de ejecución de cloud llamado UCF Unified Computing Framework, Omniverse ACE Avatar Cloud Engine y una aplicación de muestra llamada Tokkio para avatares de servicio al cliente.

Deloitte Llevará la IA y los Servicios de Omniverse a las Empresas

Además, para acelerar la adopción de todas estas tecnologías a las empresas del mundo, Deloitte, la empresa de servicios profesionales más grande del mundo, está brindando nuevos servicios basados en la IA de NVIDIA y NVIDIA Omniverse a las empresas del mundo, anunció Huang.

Dijo que los profesionales de Deloitte ayudarán a las empresas del mundo a usar los frameworks de aplicaciones de NVIDIA para desarrollar aplicaciones modernas en múltiples clouds para el servicio al cliente, la ciberseguridad, la automatización industrial, la automatización de almacenes y venta minorista y más.

Los Primeros Pasos

Huang terminó su discurso destacado retomando una charla que pasó de ofrecer nuevas tecnologías a anuncios de productos y viceversa, para unir decenas de diferentes partes en una visión única.

«El día de hoy, anunciamos nuevos chips, nuevos avances en nuestras plataformas y, por primera vez, nuevos servicios de cloud», dijo Huang al terminar. «Estas plataformas impulsan nuevos avances en IA, nuevas aplicaciones de IA y la próxima ola de IA para la ciencia y la industria».