GTC — NVIDIA anuncia un lanzamiento importante de los nuevos modelos de base mundial (WFM) NVIDIA Cosmos™ , que presentan un modelo de razonamiento abierto y totalmente personalizable para el desarrollo de IA física y brindan a los desarrolladores un control sin precedentes sobre la generación del mundo.
NVIDIA también está lanzando dos nuevos modelos, impulsados por las plataformas NVIDIA Omniverse™ y Cosmos, que brindan a los desarrolladores motores de generación de datos sintéticos masivos y controlables para robots y vehículos autónomos posteriores al entrenamiento.
Los líderes de la industria, incluidos 1X, Agility Robotics , Figure AI, Foretellix, Skild AI y Uber, se encuentran entre los primeros en adoptar Cosmos para generar datos de entrenamiento más completos para la IA física de manera más rápida y a escala.
“Así como los grandes modelos de lenguaje (LLM) revolucionaron la IA generativa y agente, los modelos de base del mundo de Cosmos suponen un gran avance para la IA física”, afirma Jensen Huang, fundador y director ejecutivo de NVIDIA. “Cosmos presenta un modelo de razonamiento abierto y totalmente personalizable para la IA física y abre oportunidades para avances en funciones escalonadas en robótica y las industrias físicas”.
“La IA física ya está siendo, y será aún más transformadora para todo el mercado. Estamos hablando de lo que hasta hace poco solo existía en la idealización y en la expectativa. Vivimos un momento en el que estas ideas finalmente salen del campo de los planes y prototipos para llegar a todos los mercados”, comenta Marcio Aguiar, director de la división Enterprise de NVIDIA para América Latina.
Transferencia de Cosmos para la Generación de Datos Sintéticos
Los WFM de Cosmos Transfer ingieren entradas de video estructuradas, como mapas de segmentación, mapas de profundidad, escaneos lidar, mapas de estimación de pose y mapas de trayectoria para generar salidas de video fotorrealistas controlables.
Cosmos Transfer agiliza el entrenamiento de la inteligencia artificial en percepción, transformando simulaciones 3D o la verdad fundamental creada en Omniverse en videos fotorrealistas para la generación de datos sintéticos controlables a gran escala.
Agility Robotics será uno de los primeros en adoptar Cosmos Transfer y Omniverse para la generación de datos sintéticos a gran escala para entrenar sus modelos de robots .
“Cosmos nos ofrece la oportunidad de ampliar nuestros datos de entrenamiento fotorrealistas más allá de lo que podemos recopilar en el mundo real”, afirma Pras Velagapudi, director de tecnología de Agility Robotics. “Nos entusiasma ver qué nuevo rendimiento podemos alcanzar con la plataforma, a la vez que aprovechamos al máximo los datos de simulación basados en la física que ya tenemos”.
El modelo NVIDIA Omniverse para la simulación de vehículos autónomos utiliza Cosmos Transfer para amplificar las variaciones de los datos físicos de los sensores. Con este modelo, Foretellix puede optimizar los escenarios de comportamiento variando condiciones como el clima y la iluminación para diversos conjuntos de datos de conducción. Parallel Domain también utiliza este modelo para aplicar variaciones similares a su simulación de sensores.
El modelo NVIDIA GR00T para la generación de movimiento de manipulación sintética combina Omniverse y Cosmos Transfer para generar diversos conjuntos de datos a escala, beneficiándose de las simulaciones impulsadas por OpenUSD y reduciendo el tiempo de recopilación y aumento de datos de días a horas.
Cosmos Predict Para la Generación de Mundos Inteligentes
Anunciados en la feria CES de enero, los modelos de mundo virtual (WFM) de Cosmos Predict generan estados de mundos virtuales a partir de entradas multimodales como texto, imágenes y video. Los nuevos modelos de Cosmos Predict permitirán la generación multifotograma, prediciendo acciones intermedias o trayectorias de movimiento al recibir imágenes de entrada de inicio y fin. Diseñados específicamente para el postentrenamiento, estos modelos se pueden personalizar utilizando el conjunto de datos de IA física de NVIDIA, disponible abiertamente.
Con la potencia informática de inferencia de los sistemas NVIDIA Grace Blackwell NVL72 y su gran dominio NVIDIA NVLink™ , los desarrolladores pueden lograr la generación del mundo en tiempo real.
1X utiliza Cosmos Predict y Cosmos Transfer para entrenar a su nuevo robot humanoide NEO Gamma. Skild AI, desarrollador de cerebros robóticos, aprovecha Cosmos Transfer para ampliar los conjuntos de datos sintéticos de sus robots. Además, Nexar y Oxa utilizan Cosmos Predict para mejorar sus sistemas de conducción autónoma.
Razonamiento Multimodal para IA Física
Cosmos Reason es un WFM abierto y totalmente personalizable con conciencia espaciotemporal que utiliza el razonamiento en cadena de pensamiento para comprender datos de video y predecir los resultados de las interacciones (como una persona que pisa un cruce de peatones o una caja que cae de un estante) en lenguaje natural.
Los desarrolladores pueden usar Cosmos Reason para mejorar la anotación y la curación de datos de la IA física, optimizar los modelos de base del mundo existentes o crear nuevos modelos de acción basados en el lenguaje de visión. También pueden entrenarlo posteriormente para crear planificadores de alto nivel que indiquen a la IA física qué debe hacer para completar una tarea.
Aceleración de la Curación de Datos y el Entrenamiento Posterior para IA Física
En función de su tarea posterior, los desarrolladores pueden realizar un entrenamiento posterior de Cosmos WFM mediante scripts nativos de PyTorch o el marco NVIDIA NeMo ™ en NVIDIA DGX™ Cloud.
Los desarrolladores de Cosmos también pueden usar NVIDIA NeMo Curator en DGX Cloud para acelerar el procesamiento y la curación de datos. Linker Vision y Milestone Systems lo utilizan para curar grandes cantidades de datos de video y entrenar grandes modelos de lenguaje (LLM) de visión para agentes visuales basados en NVIDIA AI Blueprint para la búsqueda y el resumen de videos . Virtual Incision lo está explorando para implementarlo en futuros robots quirúrgicos, mientras que Uber y Waabi avanzan en el desarrollo de vehículos autónomos.
Impulsando Una IA Responsable y la Transparencia del Contenido
De acuerdo con los principios de IA de confianza de NVIDIA, NVIDIA aplica medidas de seguridad abiertas en todos los modelos de gestión de contenido (WFM) de Cosmos. Además, NVIDIA colabora con Google DeepMind para integrar SynthID con la marca de agua y ayudar a identificar los resultados generados por IA del microservicio NVIDIA NIM™ de Cosmos WFM, disponible en build.nvidia.com.
Disponibilidad
Los WFM de Cosmos están disponibles en vista previa en el catálogo de API de NVIDIA y ahora en Vertex AI Model Garden de Google Cloud. Cosmos Predict y Cosmos Transfer están disponibles abiertamente en Hugging Face y GitHub . Cosmos Reason está disponible en acceso anticipado.
Obtenga más información mirando la conferencia principal de NVIDIA GTC y registrándose en las sesiones y capacitaciones de Cosmos de NVIDIA y los líderes de la industria en la feria, incluido “Introducción a los modelos de Cosmos World Foundation” con Ming-Yu Liu, vicepresidente de investigación de IA generativa en NVIDIA.
Acerca de NVIDIA
Desde su fundación en 1993, NVIDIA (NASDAQ: NVDA) ha sido pionera en el campo de la aceleración computacional. La invención de la GPU por parte de la compañía en 1999 estimuló el crecimiento del mercado de juegos para PC, redefinió los gráficos por ordenador, inauguró la era de la IA moderna y ha contribuido a la digitalización industrial en todos los mercados. En la actualidad, NVIDIA es una empresa de infraestructuras informáticas completas con soluciones a escala de centro de datos que están revolucionando la industria. Para saber más: Link.
Ver también:
Facebook: NVIDIALatinoamérica
Twitter: NVIDIALatinoamérica
Instagram: NVIDIALatam
YouTube: NVIDIA Latinoamérica
LinkedIn: NVIDIALatinoamérica
Información de prensa (NVIDIA):
Sing Comunicação de Resultados
Thamiris Galhardo, Alejandra Santaella, Carolina Garcia, Janaína Leme y Vânia Gracio
+ 55 (11) 5091-7838
Ciertas declaraciones en este comunicado de prensa, incluyendo, pero no limitándose a, declaraciones sobre: los beneficios, impacto, disponibilidad y rendimiento de los productos, servicios y tecnologías de NVIDIA; terceros adoptando productos y tecnologías de NVIDIA y los beneficios e impactos de estos; y Cosmos abriendo oportunidades para avances funcionales en robótica y en las industrias físicas, son declaraciones prospectivas que están sujetas a riesgos e incertidumbres que pueden hacer que los resultados difieran materialmente de las expectativas. Factores importantes que pueden hacer que los resultados reales difieran materialmente incluyen: condiciones económicas globales; nuestra dependencia de terceros para fabricar, ensamblar, empaquetar y probar nuestros productos; el impacto del desarrollo tecnológico y la competencia; el desarrollo de nuevos productos y tecnologías o mejoras en nuestros productos y tecnologías existentes; la aceptación en el mercado de nuestros productos o productos de nuestros socios; defectos de diseño, fabricación o software; cambios en las preferencias o demandas del consumidor; cambios en los estándares e interfaces de la industria; pérdida inesperada de rendimiento de nuestros productos o tecnologías cuando se integran en sistemas; así como otros factores detallados de vez en cuando en los informes más recientes que NVIDIA presenta ante la Comisión de Bolsa y Valores de los EE. UU. (SEC, por sus siglas en inglés), incluyendo, pero no limitándose a, su informe anual en el Formulario 10-K y los informes trimestrales en el Formulario 10-Q. Copias de los informes presentados ante la SEC están disponibles en el sitio web de la empresa y pueden obtenerse en NVIDIA sin costo alguno. Estas declaraciones prospectivas no son garantías de rendimiento futuro y hablan solo a partir de la fecha de este documento y, excepto cuando lo exija la ley, NVIDIA se exime de cualquier obligación de actualizar estas declaraciones prospectivas para reflejar eventos o circunstancias futuras.
© 2025 NVIDIA Corporation. Todos los derechos reservados. NVIDIA, el logotipo de NVIDIA, NVIDIA Cosmos, NVIDIA DGX, NVIDIA NeMo, NVIDIA NIM, NVIDIA Omniverse y NVLink son marcas comerciales y/o marcas registradas de NVIDIA Corporation en EE. UU. y otros países. Otros nombres de empresas y productos pueden ser marcas comerciales de las respectivas empresas a las que están asociadas. Los recursos, precios, disponibilidad y especificaciones están sujetos a cambios sin previo aviso.