Los datos empresariales están explotando: petabytes de correos electrónicos, informes, mensajes de Slack y bases de datos se acumulan más rápido de lo que cualquiera puede leer. Los empleados se quedan buscando respuestas en un mar de información, ya que «el 68% de los datos disponibles en una organización no se utilizan», según el investigador de mercado Gartner1.
Eso ahora es posible con la disponibilidad actual de AI-Q, un blueprint de NVIDIA de código abierto que pone su conocimiento empresarial al alcance de su mano. AI-Q es una implementación de referencia gratuita para crear agentes generales artificiales (AGA) que se conectan a los datos de su empresa; razonar a través de fuentes de datos multimodales utilizando los últimos modelos de AGI; y ofrecer respuestas completas, rápidas y precisas, de forma segura y a escala.
AI-Q proporciona un ejemplo de workflow fácil de usar para desarrolladores para crear un agente impulsado por IA que pueda:
- Extrair datos multimodales de diversas fuentes (texto, PDF, imágenes, tablas, bases de datos)
- Recuperar y comprender la información mediante la búsqueda semántica rápida, la generación aumentada de recuperación (RAG) y la búsqueda web con tecnología de Tavily
- Razonar, planificar y actuar con workflows avanzados basados en agentes
- Ofertar información procesable a los empleados, de forma segura y eficiente
En este blog, describiremos las características y componentes de AI-Q NVIDIA Blueprint, incluidos ejemplos de casos de uso.
El AI-Q Blueprint incluye tres componentes principales: 1) NVIDIA NIM de rendimiento optimizado, 2) microservicios NVIDIA NeMo Retriever, y 3) el Kit de herramientas NVIDIA NeMo Agent. Estas bases de IA se utilizan para crear agentes de IA robustos, escalables y confiables para cualquier dominio o industria.
Para demostrar cómo crear un agente de IA con el AI-Q Blueprint, creamos el AI-Q Research Assistant Blueprint. Muestra cómo un agente de IA puede sintetizar horas de investigación en minutos. Con los componentes básicos de AI-Q Blueprint, los agentes de IA pueden conectarse a muchas fuentes de datos, razonar y ayudar con las funciones comerciales de la empresa, incluidas las ventas, TI, desarrollo de software, marketing, recursos humanos y finanzas.
Los agentes de IA también pueden ayudar a mejorar el proceso de descubrimiento de fármacos. Para demostrar esto, NVIDIA creó un Biomedical AI-Q Research Agent Blueprint para desarrolladores que utilizan AI-Q Blueprint. Con el agente de investigación de IA biomédica, las horas de estudios de investigación médica se pueden sintetizar más rápido, lo que en última instancia reduce el tiempo requerido para la investigación y el desarrollo farmacéuticos.
Componentes y Características del Workflow de AI-Q Blueprint
Los componentes y características clave del AI-Q Blueprint incluyen:
- Extracción multimodal de datos PDF
- RAG para la recuperación de datos
- Razonamiento avanzado de IA
- Personalización e integración de IA empresarial
- Observabilidad y optimización de IA para sistemas multiagente
Extracción Multimodal de Datos PDF de Diversas Fuentes

El workflow comienza con la ingesta multimodal de datos PDF. Los datos empresariales se almacenan en una variedad de formatos: documentos de texto, PDF, imágenes, tablas y más. AI-Q Blueprint utiliza microservicios de extracción NVIDIA NeMo Retriever para ingerir e indexar datos estructurados, semiestructurados y no estructurados, utilizando computación acelerada para hacerlo hasta 15 veces más rápido y a escala de petabytes.
RAG Para Una Recuperación de Datos Eficiente y Precisa
Con NVIDIA NeMo Retriever y RAG, los datos empresariales se extraen, incrustan e indexan continuamente para que el sistema siempre funcione con la información más actualizada. Los vectores se almacenan en una base de datos acelerada por NVIDIA cuVS administrada a través de Docker Compose, lo que admite implementaciones escalables y eficientes. Esta arquitectura garantiza que las consultas de los usuarios se respondan con respuestas basadas en datos y que los controles de privacidad se apliquen en todo el pipeline.
Razonamiento Avanzado de IA para la Toma de Decisiones y la Planificación Autónomas
Utilizando un modelo de Llama Nemotron, el AI-Q Blueprint proporciona capacidades de razonamiento avanzadas, mejorando la recuperación y la reclasificación a través de la descomposición dinámica de problemas, el refinamiento iterativo y la toma de decisiones consciente del contexto. Este proceso de reflexión continua mejora la calidad y confiabilidad de los resultados generados, lo que permite a los agentes de IA proporcionar información más precisa, matizada y procesable a partir de fuentes de datos heterogéneas. Los modelos NVIDIA Llama Nemotron tienen la capacidad única de activar o desactivar dinámicamente el razonamiento para equilibrar el rendimiento y la rentabilidad, al tiempo que proporcionan velocidades de inferencia hasta 5 veces más rápidas.
Personalización e Integración de IA Empresarial para un Desarrollo Flexible
Para proporcionar a los desarrolladores una base flexible para crear agentes de IA específicos del dominio que aprovechen los datos de la empresa privada, AI-Q se integra con una amplia gama de fuentes de datos, como ERP, CRM, almacenes de datos, documentos, imágenes y registros de chat. Eso permite a los agentes de IA brindar información profundamente contextualizada para las necesidades únicas de una organización. AI-Q incluye guías de desarrollo completas que simplifican la configuración, incluidas instrucciones paso a paso para configurar entornos de Python, implementar con Docker y administrar servicios frontend y backend.
El kit de herramientas NVIDIA NeMo Agent es independiente del framework, lo que permite la integración con una amplia gama de plataformas y herramientas populares basadas en agentes. Es compatible y proporciona de forma nativa complementos propios para Agno (anteriormente Phidata), CrewAI, LangChain, LlamaIndex, MemO, Semantic Kernel, Weave y Zep Cloud, entre otros. Estas integraciones se gestionan a través de paquetes de complementos modulares, lo que permite a los desarrolladores ampliar las capacidades del kit de herramientas de acuerdo con sus requisitos de workflow. Debido a que el kit de herramientas del agente es abierto, otros miembros de la comunidad pueden ampliar aún más las integraciones del kit de herramientas.
El kit de herramientas también admite conexiones directas a las API de grandes modelos de lenguaje (LLM), incluidos NVIDIA NIM y OpenAI, y es compatible con el Protocolo de Contexto de Modelo (MCP), que permite la interoperabilidad con las herramientas servidas por los servidores MCP. Esta arquitectura flexible permite que el kit de herramientas del agente organice y optimice workflows complejos y multiagente en diversas pilas de tecnología sin necesidad de que los equipos cambien de plataforma, lo que la convierte en una capa unificadora para el desarrollo de IA empresarial.
Observabilidad y Optimización de IA Para Sistemas Multiagente Escalables
Para una implementación y orquestación escalables, el kit de herramientas del agente, incluido en el AI-Q Blueprint, proporciona API REST sin estado que administran el estado en los procesos principales, como la generación de consultas, la generación de resúmenes y las preguntas y respuestas sobre artefactos. La telemetría detallada, el registro configurable, el seguimiento y la recopilación de métricas en tiempo real proporcionados con el kit de herramientas del agente traducen las estadísticas de uso al formato OpenTelemetry para su integración con las herramientas de supervisión estándar del sector. Esto permite una trazabilidad completa del sistema, lo que permite a las empresas monitorear el rendimiento, identificar cuellos de botella y obtener una visión profunda de cómo se genera la inteligencia empresarial.
El generador de perfiles del kit de herramientas realiza un seguimiento de métricas detalladas como el uso de tokens, los tiempos de respuesta y la latencia tanto a nivel de agente como de herramienta, lo que facilita el ajuste dinámico del rendimiento y la previsión de especificaciones de workflow. Estas capacidades permiten a las organizaciones evaluar, depurar y refinar continuamente los workflows de los agentes de IA para una mayor precisión y eficiencia, lo que en última instancia respalda sistemas de IA agentic confiables, transparentes y de alto rendimiento a escala.
El Kit de Herramientas de IA Basada en Agentes Optimiza los Agentes de IA para el Área de la Salud
Maia de Therapyside ha evolucionado de un simple asistente de IA que responde a las preguntas de los terapeutas a un poderoso agente de razonamiento que automatiza tareas administrativas clave, como la programación, el seguimiento de pagos y la entrega de recursos, directamente dentro de la plataforma. Ahorra a los médicos hasta 22 minutos por paciente por día y les permite concentrarse más en la atención al paciente. El bucle de razonamiento de Maia se creó con el kit de herramientas NVIDIA NeMo Agent, que orquesta las llamadas a herramientas y el manejo de errores, y RAG con NVIDIA NeMo Retriever.
Pangaea Data creó una plataforma que utiliza IA para analizar datos estructurados y no estructurados de pacientes con respecto a las pautas clínicas establecidas. Trabajando con Alexion, la división de enfermedades raras de AstraZeneca, Pangaea Data está acelerando la detección de pacientes con enfermedades raras. Con el kit de herramientas de agente, los dos lograron una precisión del 98% en la recuperación de puntos de datos críticos y optimizaron su workflow de desarrollo, reduciendo el tiempo de configuración de las calculadoras de puntuación clínica de semanas a días.
De la Retroalimentación a la Previsión: Capacitar a los Agentes de IA para que Aprendan y Mejoren
Para garantizar que los agentes de IA brinden resultados confiables en la producción, la evaluación y optimización continuas son esenciales. El kit de herramientas del agente brinda a los desarrolladores acceso a datos detallados de telemetría y creación de perfiles, lo que facilita el monitoreo del rendimiento del agente y la identificación de áreas de mejora. Con NVIDIA Blueprint para crear flywheels, una arquitectura de referencia basada en los microservicios NVIDIA NeMo, los desarrolladores pueden permitir que los agentes aprendan y se adapten continuamente, automatizando el proceso de recopilación de comentarios y optimizando modelos para mejorar el rendimiento del sistema agente. Echa un vistazo al notebook de NVIDIA para integrar las capacidades de evaluación y creación de perfiles del kit de herramientas con un volante de datos.
Con AI-Q Blueprint, las empresas pueden encontrar significado en sus plataformas de datos de IA, sistemas de almacenamiento acelerado de proveedores de almacenamiento certificados por NVIDIA. Por ejemplo, el sistema operativo de IA de VAST Data se integra con NVIDIA AI-Q para permitir pipelines de IA multimodales en tiempo real que aprenden continuamente de los datos empresariales, impulsando soluciones de IA innovadoras en todas las industrias. VAST está trabajando con CACEIS, una de las empresas de servicios de activos más grandes de Europa, para construir una plataforma de IA en tiempo real para capturar, transcribir y analizar de forma segura las reuniones con los clientes, convirtiendo instantáneamente esos conocimientos en acción.
Comience Hoy
¿Listo para liberar todo el potencial de los datos de su empresa? El AI-Q NVIDIA Blueprint ya está disponible en GitHub, con todo lo que necesita para comenzar:
- Configuración del entorno paso a paso
- Guías de implementación para servicios RAG, modelos LLM y sistemas frontend/backend
- Instrucciones de desarrollo y pruebas locales
- Solución de problemas y preguntas frecuentes
- NVIDIA Launchable para un entorno de desarrollo de GPU desplegable con un solo clic para ayudarlo a ponerse en marcha con el ejemplo de AI-Q Research Assistant
Transforme la forma en que su organización accede al conocimiento. Cree agentes de investigación sólidos e inteligentes que potencien la toma de decisiones e impulsen la innovación, a partir de hoy.
¿Necesita ayuda para comenzar? Los socios de integración de NVIDIA, incluidos Deloitte, EY, Quantiphi, SoftServe y Tech Mahindra, están creando soluciones utilizando los componentes AI-Q Blueprint para ayudar a las organizaciones a implementar aplicaciones de IA agentic en producción.
- Gartner®, Predicts 2025: Privacy in the Age of AI and the Dawn of Quantum, enero de 2025. GARTNER® es una marca comercial registrada y un mercado de servicios de Gartner Inc. y/o sus filiales en los EE. UU. e internacionalmente y se utiliza aquí con permiso. Todos los derechos reservados.