CrowdStrike, Uber y Zoom Entre los Pioneros de la Industria Que Crean Agentes Más Inteligentes con los Modelos de Razonamiento NVIDIA Nemotron y Cosmos Para Aplicaciones de IA Empresarial y Física

Los modelos de razonamiento abierto proporcionan un pensamiento más rápido y extendido para generar resultados más inteligentes para los agentes de IA en servicio al cliente, ciberseguridad, manufactura, logística y robótica.
por Kari Briski

Los agentes de IA están preparados para entregar hasta $450 mil millones de ganancias de ingresos y ahorros de costos para 2028, según Capgemini. Los desarrolladores que crean estos agentes están recurriendo a modelos de razonamiento de mayor rendimiento para mejorar las plataformas de agentes de IA y los sistemas físicos de IA.

NVIDIA anunció una expansión de dos familias de modelos con capacidades de razonamiento, NVIDIA Nemotron y NVIDIA Cosmos, que los líderes de todas las industrias están utilizando para impulsar la productividad a través de equipos de agentes de IA y robots humanoides.

CrowdStrike, Uber, Magna, NetApp y Zoom se encuentran entre algunas de las empresas que aprovechan estas familias modelo.

Los nuevos modelos NVIDIA Nemotron Nano 2 y Llama Nemotron Super 1.5 ofrecen la mayor precisión en sus categorías de tamaño para razonamiento científico, matemáticas, codificación, llamadas de herramientas, seguimiento de instrucciones y chat. Estos nuevos modelos brindan a los agentes de IA el poder de pensar más profundamente y trabajar de manera más eficiente, explorando opciones más amplias, acelerando la investigación y brindando resultados más inteligentes dentro de los límites de tiempo establecidos.

Piense en el modelo como el cerebro de un agente de IA: proporciona la inteligencia central. Pero para que ese cerebro sea útil para una empresa, debe estar integrado en un agente que comprenda workflows específicos, además de la jerga de la industria y los negocios, y opere de manera segura. NVIDIA ayuda a las empresas a cerrar esa brecha con bibliotecas líderes y planos de IA para incorporar, personalizar y gobernar agentes de IA a escala.

Cosmos Reason es un nuevo modelo de lenguaje de visión de razonamiento  (VLM) para aplicaciones de IA física que sobresale en la comprensión de cómo funciona el mundo real, utilizando el razonamiento estructurado para comprender conceptos como la física, la permanencia de los objetos y la alineación espacio-temporal. El VLM encabezó la Tabla de Clasificación de Razonamiento Físico en Hugging Face.

Cosmos Reason está diseñado específicamente para servir como columna vertebral de razonamiento para un modelo de acción de lenguaje de visión robótica (VLA), o criticar y subtitular datos de entrenamiento para robótica y vehículos autónomos, y equipar a los agentes de IA visual en tiempo de ejecución con comprensión espacio-temporal y razonamiento de operaciones físicas, como en fábricas o ciudades.

Nemotron: Máxima Precisión y Eficiencia para la IA Empresarial Basada en Agentes

A medida que las empresas desarrollan agentes de IA para abordar tareas complejas de varios pasos, los modelos que pueden proporcionar una gran precisión de razonamiento con una generación eficiente de tokens permiten una toma de decisiones inteligente y autónoma a escala.

NVIDIA Nemotron es una familia de modelos avanzados de razonamiento abierto que utilizan modelos líderes, conjuntos de datos abiertos seleccionados por NVIDIA y técnicas avanzadas de IA para proporcionar un punto de partida preciso y eficiente para los agentes de IA.

Los últimos modelos de Nemotron ofrecen una eficiencia líder de tres maneras: una nueva arquitectura de modelo híbrido, modelos cuantificados compactos y un presupuesto de pensamiento configurable que proporciona a los desarrolladores control sobre la generación de tokens, lo que resulta en costos de razonamiento un 60% más bajos. Esta combinación permite que los modelos razonen más profundamente y respondan más rápido, sin necesidad de más tiempo o potencia la computación. Esto significa mejores resultados a un menor costo.

Nemotron Nano 2 proporciona una generación de tokens hasta 6 veces mayor en comparación con otros modelos líderes de su tamaño.

Llama Nemotron Super 1.5 logra un rendimiento líder y la mayor precisión de razonamiento en su clase, lo que permite a los agentes de IA razonar mejor, tomar decisiones más inteligentes y manejar tareas complejas de forma independiente. Ahora está disponible en NVFP4, o punto flotante de 4 bits, que ofrece un rendimiento hasta 6 veces mayor en las GPU NVIDIA B200 en comparación con las GPU NVIDIA H100.

El gráfico anterior muestra que el modelo Nemotron ofrece la máxima precisión de razonamiento en el mismo período de tiempo y con el mismo presupuesto de cómputo, brindando la mayor precisión por dólar.

Junto con los dos nuevos modelos de Nemotron, NVIDIA también anuncia su primer conjunto de datos de entrenamiento VLM abierto, el conjunto de datos Llama Nemotron VLM v1, con 3 millones de muestras de reconocimiento óptico de caracteres, control de calidad visual y datos de subtítulos que impulsan el modelo Llama 3.1 Nemotron Nano VL 8B lanzado anteriormente.

Además de la precisión de los modelos de razonamiento, los agentes también confían en la generación aumentada de recuperación para obtener la información más reciente y relevante de los datos conectados a través de fuentes dispares para tomar decisiones informadas. El modelo de incrustación Llama 3.2 NeMo Retriever recientemente lanzado encabeza tres tablas de clasificación de recuperación de documentos visuales:ViDoRe V1, ViDoRe V2 y MTEB VisualDocumentRetrieval para aumentar la precisión del sistema basado en agentes.

Utilizando estos modelos de razonamiento y recuperación de información, un agente de investigación profunda construido con AI-Q NVIDIA Blueprint es actualmente el número 1 para agentes abiertos y portátiles en el DeepResearch Bench.

Los microservicios NVIDIA NeMo y NVIDIA NIM admiten todo el ciclo de vida del agente de IA, desde el desarrollo y la implementación hasta el monitoreo y la optimización de los sistemas basados en agentes.

Cosmos Reason: Un Gran Avance en la IA Física

Los VLM marcaron un gran avance para la visión por computadora y la robótica, ya que permitieron a las máquinas identificar objetos y patrones. Sin embargo, los VLM no razonados carecen de la capacidad de comprender e interactuar con el mundo real, lo que significa que no pueden manejar ambigüedades o experiencias novedosas, ni resolver tareas complejas de varios pasos.

NVIDIA Cosmos Reason es un nuevo VLM de razonamiento abierto, personalizable y de 7 mil millones de parámetros para IA física y robótica. Cosmos Reason permite que los robots y los agentes de IA de visión razonen como humanos, utilizando conocimientos previos, comprensión de la física y sentido común para comprender y actuar en el mundo físico.

Cosmos Reason permite capacidades avanzadas en aplicaciones de robótica e IA física, como entrenamiento, crítica y subtítulos de datos, toma de decisiones robótica y agentes de IA de análisis de video.

Puede ayudar a automatizar la curación y anotación de conjuntos de datos de entrenamiento grandes y diversos, acelerando el desarrollo de modelos de IA de alta precisión. También puede servir como un sofisticado motor de razonamiento para la planificación de robots, analizando instrucciones complejas en pasos procesables para modelos VLA, incluso en nuevos entornos.

También impulsa los agentes de IA de análisis de video basados en NVIDIA Blueprint para la búsqueda y resumen de video (VSS), habilitados por la plataforma NVIDIA Metropolis, obteniendo información valiosa de volúmenes masivos de datos de video almacenados o en vivo. Estos agentes de IA visualmente perceptivos e interactivos pueden ayudar a optimizar las operaciones en fábricas, almacenes, tiendas minoristas, aeropuertos, intersecciones de tráfico y más al detectar anomalías.

El equipo de investigación de robótica de NVIDIA utiliza Cosmos Reason para la filtración y curación de datos, y como el VLM de razonamiento del «Sistema 2» detrás de los modelos VLA, como las próximas versiones de NVIDIA Isaac GR00T NX.

Ahora Sirviendo: Modelos de Razonamiento de NVIDIA para Agentes y Robots de IA en Todas Partes

Diversas empresas y líderes de consultoría están adoptando los últimos modelos de razonamiento de NVIDIA. Los líderes que abarcan desde la ciberseguridad hasta las telecomunicaciones se encuentran entre los que trabajan con Nemotron para crear agentes de IA empresarial.

Zoom planea aprovechar los modelos de razonamiento de Nemotron con Zoom AI Companion para tomar decisiones y administrar tareas de varios pasos para tomar medidas para los usuarios en Zoom Meetings, Zoom Chat y documentos de Zoom.

CrowdStrike está probando los modelos de Nemotron para permitir que sus agentes de IA de Charlotte escriban consultas en la plataforma CrowdStrike Falcon.

Amdocs está utilizando modelos NVIDIA Nemotron en su suite amAIz para impulsar a los agentes de IA a manejar la automatización compleja de varios pasos que abarca la atención, las ventas, la red y el soporte al cliente.

EY está adoptando Nemotron Nano 2, dado su alto rendimiento, para apoyar la IA basada en agentes en grandes organizaciones para casos de uso fiscales, de gestión de riesgos y financieros.

NetApp está probando actualmente los modelos de razonamiento de Nemotron para que los agentes de IA puedan buscar y analizar datos empresariales

DataRobot está trabajando con modelos de Nemotron para su plataforma Agent Workforce para la gestión integral del ciclo de vida de los agentes.

Tabnine está trabajando con los modelos de Nemotron para sugerir y automatizar tareas de codificación en nombre de los desarrolladores.

Automation Anywhere, CrewAI y Dataiku se encuentran entre los desarrolladores de software de IA basada en agentes adicionales que integran modelos de Nemotron en sus plataformas.

Las empresas líderes en transporte, seguridad e IA están utilizando Cosmos Reason para avanzar en la conducción autónoma, el análisis de video y la seguridad vial y laboral.

Uber está explorando Cosmos Reason para analizar el comportamiento de los vehículos autónomos. Además, Uber está capacitando a Cosmos Reason para resumir datos visuales y analizar escenarios como peatones que caminan por carreteras para realizar análisis de calidad e informar el comportamiento de conducción autónoma.

Cosmos Reason también puede servir como cerebro de vehículos autónomos. Permite a los robots interpretar entornos y, dados comandos complejos, dividirlos en tareas y ejecutarlas usando el sentido común, incluso en entornos desconocidos.

Centific está probando Cosmos Reason para mejorar su plataforma de inteligencia de video impulsada por IA. El VLM permite que la plataforma procese datos de video complejos en información procesable, lo que ayuda a reducir los falsos positivos y mejorar la eficiencia de la toma de decisiones.

VAST está avanzando en la inteligencia urbana en tiempo real utilizando NVIDIA Cosmos Reason con su sistema operativo de IA para procesar transmisiones de video masivas a escala. Con VSS Blueprint, VAST puede crear agentes que pueden identificar incidentes y desencadenar respuestas, convirtiendo transmisiones de video y metadatos en herramientas de seguridad pública proactivas y procesables.

Ambient.ai está trabajando con el razonamiento temporal y consciente de la física de Cosmos Reason, para permitir la detección automatizada de equipos de protección personal faltantes y el monitoreo de condiciones peligrosas, lo que ayuda a mejorar la salud y la seguridad ambiental en la construcción, la fabricación, la logística y otros entornos industriales.

Magna se está desarrollando con Cosmos Reason como parte de su City Delivery Platform, una solución totalmente autónoma y de bajo costo para la entrega instantánea, para ayudar a los vehículos a adaptarse más rápidamente a las nuevas ciudades. El modelo agrega comprensión del mundo a la planificación de la trayectoria a largo plazo de los vehículos.

Se espera que estos modelos estén disponibles como microservicios NVIDIA NIM para una implementación segura y confiable en cualquier infraestructura acelerada por NVIDIA para obtener la máxima privacidad y control. Está previsto que estén disponibles pronto a través de Amazon Bedrock y Amazon SageMaker AI para modelos de Nemotron, así como a través de Azure AI Foundry, Oracle Data Science Platform y Google Vertex AI.

Pruebe Cosmos Reason en build.nvidia.com o descárguelo de Hugging Face o GitHub.

Nemotron Nano 2 y Llama Nemotron Super 1.5 (NVFP4) estarán disponibles pronto para su descarga. Mientras tanto, obtenga más información sobre los modelos de Nemotron y descargue versiones anteriores.

Descargue el Llama Nemotron VLM Dataset v1 de Hugging Face.