Cómo los Agentes de IA de Razonamiento Transforman la Toma de Decisiones de Alto Riesgo

por Amanda Saunders

Los agentes de IA impulsados por grandes modelos de lenguaje (LLM) han superado sus inicios en el chatbot de preguntas frecuentes para convertirse en verdaderos compañeros de equipo digitales capaces de planificar, razonar y tomar medidas, y recibir comentarios correctivos en el camino.

Gracias a los modelos de IA de razonamiento, los agentes pueden aprender a pensar críticamente y abordar tareas complejas. Esta nueva clase de «agentes de razonamiento» puede analizar problemas complicados, sopesar opciones y tomar decisiones informadas, mientras usa solo la cantidad de cómputo y tantos tokens como sea necesario.

Los agentes de razonamiento están causando sensación en industrias donde las decisiones dependen de múltiples factores. Dichas industrias van desde el servicio al cliente y el área de la salud hasta la manufactura y los servicios financieros.

Razonamiento Encendido vs. Razonamiento Apagado

Los agentes de IA modernos pueden activar y desactivar el razonamiento, lo que les permite utilizar de forma eficiente el proceso y los tokens.

Un  paso completo de cadena de pensamiento realizado durante el razonamiento puede requerir hasta 100 veces más computación y tokens que una respuesta rápida de un solo disparo, por lo que solo debe usarse cuando sea necesario. Piense en ello como encender las luces delanteras: encender las luces altas solo cuando está oscuro y volver a bajarlas cuando hay suficiente luz.

Las respuestas únicas son excelentes para consultas simples, como verificar un número de pedido, restablecer una contraseña o responder preguntas frecuentes rápidas. Es posible que se necesite un razonamiento para tareas complejas y de varios pasos, como conciliar los programas de depreciación fiscal u orquestar los asientos en una boda de 120 invitados.

Los nuevos modelos NVIDIA Llama Nemotron, que cuentan con capacidades de razonamiento avanzadas, exponen un indicador de sistema simple para habilitar o deshabilitar el razonamiento, de modo que los desarrolladores puedan decidir mediante programación por consulta. Esto permite a los agentes realizar el razonamiento solo cuando lo exige lo que está en juego, lo que ahorra a los usuarios tiempos de espera y minimiza los costos.

Agentes de IA de Razonamiento en Acción

Los agentes de IA de razonamiento ya se están utilizando para la resolución de problemas complejos en todas las industrias, entre ellos:

  • Área de la Salud: Mejorar el diagnóstico y la planificación del tratamiento.
  • Servicio al Cliente: Automatización y personalización de interacciones complejas con los clientes, desde la resolución de disputas de facturación hasta la recomendación de productos personalizados.
  • Finanzas: Analizar de forma autónoma los datos del mercado y proporcionar estrategias de inversión.
  • Logística y Cadena de Suministro: Optimización de rutas de entrega, desvío de envíos en respuesta a interrupciones y simulación de posibles escenarios para anticipar y mitigar riesgos.
  • Robótica: Impulsa robots de almacén y vehículos autónomos, lo que les permite planificar, adaptarse y navegar de forma segura por entornos dinámicos.

Muchos clientes ya están experimentando workflows mejorados y beneficios al utilizar agentes de razonamiento.

Amdocs utiliza agentes de IA impulsados por el razonamiento para transformar la participación del cliente para los operadores de telecomunicaciones. Su plataforma amAIz GenAI, mejorada con modelos de razonamiento avanzados como NVIDIA Llama Nemotron y la verticalización de amAIz Telco, permite a los agentes manejar de forma autónoma recorridos de clientes complejos y de varios pasos, que abarcan las ventas, la manufactura y la atención al cliente.

EY está utilizando agentes de razonamiento para mejorar significativamente la calidad de las respuestas a las consultas relacionadas con los impuestos. La compañía comparó modelos genéricos con modelos de razonamiento específicos de impuestos, que revelaron una mejora de hasta el 86% en la calidad de respuesta a las preguntas fiscales cuando se utilizó un enfoque de razonamiento.

Los agentes Joule de SAP, que estarán equipados con las capacidades de razonamiento de Llama Nemotron, pueden interpretar solicitudes complejas de los usuarios, extraer información relevante de los datos empresariales y ejecutar procesos de negocio multifuncionales de forma autónoma.

Diseño de Un Agente de Razonamiento de IA

Se requieren algunos componentes clave para crear un agente de IA, incluidas las herramientas, la memoria y los módulos de planificación. Cada uno de estos componentes aumenta la capacidad del agente para interactuar con el mundo exterior, crear y ejecutar planes detallados y actuar de forma semi o totalmente autónoma.

Las capacidades de razonamiento se pueden agregar a los agentes de IA en varios lugares del proceso de desarrollo. La forma más natural de hacerlo es aumentando los módulos de planificación con un modelo de razonamiento grande, como Llama Nemotron Ultra o DeepSeek-R1. Esto permite utilizar más tiempo y esfuerzo de razonamiento durante la fase de planificación inicial del workflow agente, lo que tiene un impacto directo en los resultados generales de los sistemas.

AI-Q NVIDIA AI Blueprint y NVIDIA Agent Intelligence toolkit pueden ayudar a las empresas a romper los silos, optimizar los workflows complejos y optimizar el rendimiento de la IA de los agentes a escala.

El proyecto AI-Q proporciona un workflow de referencia para crear sistemas avanzados de IA basada en agentes, lo que facilita la conexión a la computación acelerada, el almacenamiento y las herramientas de NVIDIA para fuerzas de trabajo digitales de alta precisión y alta velocidad. AI-Q integra una rápida extracción y recuperación de datos multimodal mediante NVIDIA NeMo Retriever, microservicios NIM y agentes de IA.

Además, el kit de herramientas de código abierto NVIDIA Agent Intelligence permite una conectividad perfecta entre agentes, herramientas y datos. Disponible en GitHub, este kit de herramientas permite a los usuarios conectar, perfilar y optimizar equipos de agentes de IA, con trazabilidad completa del sistema y perfiles de rendimiento para identificar ineficiencias y mejorar los resultados. Es independiente del framework, fácil de incorporar y se puede integrar en los sistemas multiagente existentes según sea necesario.

Construya y Pruebe Agentes de Razonamiento con Llama Nemotron

Obtenga más información sobre Llama Nemotron, que recientemente estuvo en la cima de las tablas de clasificación de referencia de la industria  para tareas avanzadas de ciencias, codificación y matemáticas. Únete a la comunidad que da forma al futuro de la IA basada en agentes impulsada por el razonamiento.

Además, explore y ajuste el uso del conjunto de datos abierto de posentrenamiento de Llama Nemotron  para crear agentes de razonamiento personalizados. Experimente activando y desactivando el razonamiento para optimizar el costo y el rendimiento.

Y pruebe los workflows de agentes impulsados por NIM, incluida la generación de recuperación aumentada y NVIDIA AI Blueprint para la búsqueda y el resumen de videos, para crear prototipos e implementar rápidamente soluciones de IA avanzadas.