Optimice los sistemas de decisión en la cadena de suministro con las habilidades de agente NVIDIA cuOpt

por Rajath Narasimha

Las cadenas de suministro modernas operan bajo las presiones constantes de la demanda fluctuante, los costos volátiles, la capacidad limitada y la toma de decisiones interdependientes. Tradicionalmente, equipos especializados en investigación de operaciones (OR) resolvían estos problemas traduciendo preguntas de negocio en modelos matemáticos. Este proceso puede llevar semanas y con frecuencia produce soluciones frágiles que tienen dificultades para adaptarse cuando las condiciones cambian.

La AI agéntica está cambiando este paradigma. Combinando las capacidades de razonamiento de los LLMs con la potencia computacional de los solvers acelerados por GPU, los agentes de AI pueden interpretar problemas de negocio expresados en lenguaje natural y traducirlos en decisiones rigurosas y optimizadas en segundos.

En el corazón de este enfoque se encuentran las habilidades de agente —un formato abierto para extender los agentes con conocimientos y workflows especializados. Las habilidades actúan como un mecanismo de empaquetado que carga dinámicamente el contexto de procedimiento correcto y mejora el rendimiento del agente en tareas específicas.

Esta publicación describe las principales habilidades de agente de NVIDIA cuOpt, su importancia y cómo trabajan juntas para acelerar un caso de uso de planificación de cadena de suministro de múltiples períodos, convirtiendo problemas de negocio en lenguaje natural en modelos matemáticos y resolviéndolos con el solver de optimización de decisiones NVIDIA cuOpt.

Cómo usar las habilidades de agente de NVIDIA cuOpt

NVIDIA cuOpt es un motor de optimización de decisiones acelerado por GPU que resuelve problemas de programación lineal (LP), programación entera mixta (MIP) y problemas de enrutamiento varios órdenes de magnitud más rápido que los solvers basados en CPU. Al poner cuOpt disponible como una habilidad de agente, el LLM puede delegar el trabajo matemático pesado a la GPU, mientras se concentra en comprender el problema de negocio, recopilar datos y devolver resultados accionables.

Los siguientes pasos describen cómo configurar y usar el workflow de referencia del agente de cadena de suministro de NVIDIA cuOpt, que utiliza habilidades de agente de cuOpt para realizar la optimización de la cadena de suministro acelerada por GPU mediante workflows impulsados por agentes.

Paso 1: Configurar el entorno

Aprovisione un sistema con una GPU NVIDIA e instale el NVIDIA Container Toolkit, que permite el acceso a la GPU dentro de cargas de trabajo en contenedores. Puede ejecutar esto en su propia infraestructura o implementar un Brev Launchable para un entorno GPU preconfigurado en la nube con NVIDIA CUDA, Docker y otros requisitos previos ya instalados.

Luego, instale el paquete de agente cuOpt junto con sus dependencias. La aplicación de demostración ya está en contenedores, lo que garantiza la reproducibilidad y simplifica la implementación en entornos de desarrollo, staging y producción.

Paso 2: Inicializar el agente

El agente utiliza MiniMax M2.5 como su modelo de razonamiento. Use los endpoints alojados públicamente o, para mejor rendimiento, implemente el NVIDIA NIM localmente.

El resto del proceso de implementación es sencillo. Dado que la aplicación está en contenedores, un simple comando de Docker Compose lanza la interfaz de usuario y el rastreo de Phoenix en sus puertos específicos, que puede abrir en nuevas pestañas.

El código fuente incluye algunas habilidades que el agente puede utilizar. Estas habilidades actúan como firmas de función bien definidas que el LLM puede invocar. Cada una encapsula una capacidad de optimización específica (por ejemplo, planificación de producción, optimización de inventario o optimización de rutas) junto con esquemas de entrada/salida. Registrar las habilidades de esta manera permite al LLM descubrirlas e invocarlas dinámicamente según la intención del usuario.

Paso 3: Proporcionar los datos de la cadena de suministro

Suministre al agente los datos específicos del dominio necesarios para la optimización. Para un problema de planificación de múltiples períodos, esto típicamente incluye:

  • Pronósticos de demanda por producto, región y período de tiempo.
  • Capacidad de producción y costos unitarios entre instalaciones.
  • Costos de almacenamiento de inventario y límites de almacenamiento.
  • Costos de transporte y tiempos de entrega.
  • Restricciones de negocio como acuerdos de nivel de servicio o ejecuciones de producción mínimas.

En una implementación productiva, estos datos se extraen directamente de los sistemas de planificación. Para propósitos de demostración, el workflow de referencia utiliza conjuntos de datos simulados que reflejan la estructura del mundo real.

Paso 4: Invocar las habilidades del agente

Solicite al agente un objetivo operativo en lenguaje natural, como «Genera un plan de producción e inventario de 12 semanas que minimice el costo total mientras satisface la demanda pronosticada en todos los centros de distribución.»

Bajo el capó, el workflow utiliza LangChain Deep Agents para generar una jerarquía de sub-agentes, cada uno responsable de una porción del workflow. El agente orquestador razona sobre el objetivo, lo descompone en pasos y delega tareas. Un sub-agente puede extraer y validar datos de entrada, otro puede formular el modelo matemático y otro puede invocar la habilidad de cuOpt.

Cuando se llama a la habilidad de cuOpt, el agente pasa un payload estructurado que contiene variables de decisión, función objetivo y restricciones al solver de cuOpt.

Paso 5: Recuperar y actuar sobre la solución

cuOpt ejecuta la optimización en la GPU utilizando paralelismo masivo para evaluar el espacio de soluciones más rápido que los solvers CPU tradicionales. Una vez que se encuentra una solución, el agente recibe las variables de decisión optimizadas (por ejemplo, cuánto producir de cada producto en cada período, cuánto inventario mantener o adónde enviarlo) y las traduce de vuelta a un resumen legible por humanos. Esto frecuentemente incluye métricas clave como el costo total, la utilización de capacidad y la holgura de restricciones.

El resultado es un plan accionable que los tomadores de decisiones pueden revisar, refinar mediante prompts de seguimiento o enviar directamente a los sistemas de ejecución posteriores.

Vea el siguiente tutorial para obtener más información sobre cómo configurar y ejecutar el workflow de referencia del agente de cadena de suministro de cuOpt usando el NVIDIA Brev Launchable.

Arquitectura agéntica extensible

An extended architectural pattern around the NVIDIA cuOpt supply chain agent reference workflow, wrapping the core agents with enterprise coordination, governance, and reliability, and extensible through agent skills.

El workflow de referencia del agente de cadena de suministro de cuOpt es un punto de partida simplificado. Puede extenderlo con habilidades de agente adicionales y patrones de orquestación para adaptarse mejor a sus cargas de trabajo empresariales en producción. El diagrama de arquitectura a continuación muestra un patrón extensible para agregar coordinación, gobernanza, confiabilidad y robustez de nivel empresarial alrededor del workflow central del agente.

Enlaces rápidos al conjunto de datos y al repositorio de GitHub

Comience con este workflow de agente cuOpt en GitHub. Siga la guía de inicio rápido para ejecutar el ejemplo localmente, o use un NVIDIA Brev Launchable para lanzar una instancia GPU en la nube con un Jupyter Notebook precargado que le guía a través de la implementación de este ejemplo.

Requisitos técnicos previos:

Comenzar

Implemente el workflow de referencia del Agente NVIDIA cuOpt usando el NVIDIA NeMo Agent Toolkit y use las habilidades de optimización integradas, o cree las suyas. Ejecute consultas estructuradas e integre restricciones específicas del dominio en los workflows, y extienda las habilidades de cuOpt para evaluar métricas y optimizar sus propios casos de uso específicos del dominio.

Manténgase al día con NVIDIA cuOpt suscribiéndose a las noticias de NVIDIA y siguiendo NVIDIA AI en LinkedIn, X, Discord y YouTube.

Visite la página de inicio de cuOpt para recursos en Google Colab, NVIDIA API Catalog, GitHub y NVIDIA AI Enterprise.

Participe con la comunidad de desarrolladores en el foro de NVIDIA y Discord.