Creando Espacios Más Seguros: NVIDIA y Sus Socios Llevan la IA Física a las Ciudades y la Infraestructura Industrial

Los blueprints avanzados, los modelos de lenguaje de visión y las extensiones de generación de datos sintéticos aceleradas por las GPU NVIDIA RTX PRO 6000 Blackwell mejoran la productividad y mejoran la seguridad en todos los entornos.
por Alessandro Oliveira

La IA física se está convirtiendo en la base de las ciudades, instalaciones y procesos industriales inteligentes en todo el mundo.

NVIDIA está trabajando con empresas como Accenture, Avathon, Belden, DeepHow, Milestone Systems y Telit Cinterion para mejorar las operaciones en todo el mundo con percepción y razonamiento físicos basados en IA.

El ciclo continuo de simulación, entrenamiento e implementación de IA física ofrece sofisticadas capacidades de automatización industrial, lo que hace que las ciudades y las infraestructuras sean más seguras, inteligentes y eficientes.

Por ejemplo, las aplicaciones físicas de IA pueden automatizar tareas potencialmente peligrosas para los trabajadores, como trabajar con maquinaria pesada. La IA física también puede mejorar los servicios de transporte y la seguridad pública, detectar productos defectuosos en las fábricas y más.

La necesidad de esto es mayor que nunca. Los números cuentan la historia:

Statistics in infographic: $7 Trillion lost annually due to poor quality and defects in manufacturing. ~2.8 Million workers die annually from occupational accidents and work-related diseases. 514,000 industrial robots installed worldwide in 2024. $300 billion spent per year on public order and safety in the EU. By 2030, projected global labor shortage of 50 million.

La infraestructura que puede percibir, razonar y actuar se basa en sensores de video y las últimas capacidades de IA de visión. Con la plataforma NVIDIA Metropolis, que simplifica el desarrollo, la implementación y el escalado de agentes de IA de análisis de video y servicios desde el borde hasta la nube, los desarrolladores pueden incorporar la percepción visual en sus instalaciones más rápido para mejorar la productividad y mejorar la seguridad en todos los entornos.

A continuación se muestran cinco empresas líderes que avanzan en la IA física, y cinco actualizaciones clave de NVIDIA Metropolis, anunciadas recentemiente en la conferencia de SIGGRAPH, que hacen posible tales avances.

Cinco Empresas Que Avanzan en la IA Física

La empresa global de servicios profesionales Accenture está colaborando con Belden, un proveedor líder de soluciones de conexión completas, para mejorar la seguridad de los trabajadores mediante la creación de cercas virtuales inteligentes que las fábricas pueden colocar alrededor de grandes robots para evitar accidentes con operadores humanos.

Smart fence image.
Imagen cortesía de Accenture y Belden.

La valla virtual inteligente es un sistema de seguridad de IA física que utiliza un gemelo digital basado en OpenUSD y simulación basada en la física para modelar entornos industriales complejos. Utilizando mapeo basado en visión por computadora e inteligencia espacial 3D, el sistema se adapta a una mayor variabilidad en las interacciones dinámicas entre humanos y robots que ocurren en un entorno de taller moderno.

Accenture aprovecha la  plataforma NVIDIA Omniverse y Metropolis para construir y simular estas vallas inteligentes. Con Omniverse, Accenture creó un gemelo digital de un brazo robótico y trabajadores que se mueven en un espacio. Y con Metropolis, la compañía entrenó sus modelos de IA y los implementó en el borde con la ingesta de video y las capacidades de inferencia en tiempo real del kit de desarrollo de software (SDK) NVIDIA DeepStream.

Avathon, un proveedor de plataformas de automatización industrial, utiliza NVIDIA Blueprint para la búsqueda y resumen de videos (VSS), parte de NVIDIA Metropolis, para proporcionar a las instalaciones de manufactura y energía información en tiempo real que mejora la eficiencia operativa y la seguridad de los trabajadores.

Reliance British Petroleum Mobility Limited, líder en el sector de combustible y movilidad de la India, utilizó el producto de inteligencia de video Avathon durante la construcción de sus gasolineras para lograr estándares más altos de cumplimiento de seguridad, una reducción en los incidentes de incumplimiento de seguridad y una mayor productividad al ahorrar miles de horas de trabajo.

DeepHow ha desarrollado un «Smart Know-How Companion» para empleados de manufactura y otras industrias. El compañero utiliza el modelo VSS de Metropolis para transformar los workflows clave en videos multilingües e instrucciones digitales de tamaño reducido, mejorando la incorporación, la seguridad y la eficiencia del operador de piso.

Frente a las necesidades de mejora de las habilidades y la jubilación de trabajadores calificados, la empresa de bebidas Anheuser-Busch InBev recurrió a la plataforma DeepHow para convertir los procedimientos operativos estándar en guías visuales fáciles de entender. Esto ha reducido el tiempo de incorporación en un 80%, ha aumentado la consistencia de la capacitación y ha mejorado la retención de conocimientos a largo plazo para los empleados.

Milestone Systems, que ofrece una de las plataformas más grandes del mundo para administrar datos de sensores de video IP en implementaciones industriales y urbanas complejas, está creando la biblioteca de datos de visión por computadora del mundo real más grande del mundo a través de su plataforma, Project Hafnia. Entre sus capacidades, la plataforma proporciona a los desarrolladores físicos de IA acceso a modelos de lenguaje de visión (VLM) personalizados.

Aprovechando NVIDIA NeMo Curator, Milestone Systems creó un VLM ajustado para sistemas de transporte inteligentes para su uso dentro del modelo VSS para ayudar a desarrollar agentes de IA que administren mejor las carreteras de la ciudad. Milestone Systems también está buscando utilizar el nuevo VLM NVIDIA Cosmos Reason abierto y personalizable para IA física.

Empresa de Internet de las cosas Telit Cinterion ha integrado el Kit de herramientas NVIDIA TAO 6.0 en su plataforma de inspección visual impulsada por IA, que utiliza modelos de base de visión como FoundationPose, junto con otros modelos de NVIDIA, para admitir IA multimodal y ofrecer inferencias de alto rendimiento. TAO aporta capacidades de IA de bajo código a la plataforma Telit, lo que permite a los fabricantes desarrollar e implementar rápidamente modelos de IA precisos y personalizados para la detección de defectos y el control de calidad.

Cinco Actualizaciones de NVIDIA Metropolis para IA Física

Las actualizaciones clave de NVIDIA Metropolis están mejorando las capacidades de los desarrolladores para crear aplicaciones físicas de IA de manera más rápida y sencilla:

Cosmos Reason VLM

La última versión de Cosmos Reason, el VLM avanzado de razonamiento abierto, personalizable y de 7 mil millones de parámetros de NVIDIA para IA física, permite la comprensión de video contextual, el razonamiento de eventos temporales para casos de uso de Metropolis. Su tamaño compacto facilita su implementación desde el borde hasta la nube y es ideal para automatizar el monitoreo del tráfico, la seguridad pública, la inspección visual y la toma de decisiones inteligente.

VSS Blueprint 2.4

VSS 2.4 facilita el aumento rápido de las aplicaciones de IA de visión existentes con Cosmos Reason y ofrece nuevas y potentes funciones a la infraestructura inteligente. Un conjunto ampliado de interfaces de programación de aplicaciones en el blueprint ofrece a los usuarios directos más flexibilidad en la elección de componentes y capacidades específicos de VSS para aumentar los pipelines de visión artificial con IA generativa.

Nuevos Modelos Base de Visión

El kit de herramientas NVIDIA TAO incluye un nuevo conjunto de modelos básicos de visión, junto con métodos avanzados de ajuste, aprendizaje autosupervisado y capacidades de destilación de conocimientos, para optimizar la implementación de soluciones físicas de IA en entornos de borde y nube. El SDK de NVIDIA DeepStream incluye un nuevo Inference Builder para permitir una implementación perfecta de los modelos TAO 6.

Empresas de todo el mundo, incluidas Advex AI, Instrumental AI y Spingence, están experimentando con estos nuevos modelos y NVIDIA TAO para crear soluciones inteligentes que optimicen las operaciones industriales e impulsen la eficiencia.

Extensiones de NVIDIA Isaac Sim

Las nuevas extensiones en la aplicación de referencia NVIDIA Isaac Sim ayudan a resolver desafíos comunes en el desarrollo de IA de visión, como datos etiquetados limitados y escenarios raros de casos extremos. Estas herramientas simulan interacciones humanas y robóticas, generan conjuntos de datos ricos de detección de objetos y crean escenas basadas en incidentes y pares de imágenes y subtítulos para entrenar VLM, acelerando el desarrollo y mejorando el rendimiento de la IA en condiciones del mundo real.

Soporte de Hardware Ampliado

Todos estos componentes de Metropolis ahora pueden ejecutarse en GPU NVIDIA RTX PRO 6000 Blackwell, la  supercomputadora de escritorio NVIDIA DGX Spark y la  plataforma NVIDIA Jetson Thor para IA física y robótica humanoide, para que los usuarios puedan desarrollar e implementar desde el borde hasta la nube.

Cosmos Reason 1 y NVIDIA TAO 6.0 ya están disponibles para su descarga. Regístrese para recibir informaciones cuando VSS 2.4, la actualización de ajuste de Cosmos Reason VLM y NVIDIA DeepStream 8.0 estén disponibles.