Laboratorio Nemotron: Cómo los Agentes de IA Están Convirtiendo Documentos en Inteligencia Empresarial en Tiempo Real

Hoy en día, las empresas se enfrentan al reto de descubrir valiosas ideas ocultas en una amplia variedad de documentos, incluyendo informes, presentaciones, PDFs, páginas web y hojas de cálculo.

A menudo, los equipos recopilan los conocimientos revisando manualmente archivos, copiando datos en hojas de cálculo, construyendo paneles de control y utilizando herramientas básicas de búsqueda o reconocimiento óptico de caracteres (OCR) basadas en plantillas que a menudo pasan por alto detalles importantes en medios complejos.

El procesamiento inteligente de documentos es un workflow impulsado por IA que lee, entiende y extrae automáticamente información de los documentos. Interpreta formatos ricos dentro de esos documentos, incluyendo tablas, gráficos, imágenes y texto, utilizando agentes de IA y técnicas como la generación aumentada por recuperación (RAG) para convertir el contenido multimodal en conocimientos que otros sistemas multiagente y oersonas pueden utilizar fácilmente.

Con los modelos abiertos NVIDIA Nemotron y las bibliotecas aceleradas por GPU, las empresas pueden construir sistemas de inteligencia documental impulsados por IA para investigación, servicios financieros, workflows legales y más.

Estos modelos abiertos, conjuntos de datos y recetas de entrenamiento han impulsado resultados sólidos en tablas de clasificación como MTEB, MMTEB y ViDoRe V3, referencias para evaluar modelos de recuperación multilingües y multimodales. Los equipos pueden elegir entre los mejores modelos para tareas como búsqueda y respuesta a preguntas.

Cómo el Procesamiento Documental Agiliza la Inteligencia Empresarial

Los sistemas de inteligencia documental que pueden extraer significado de diseños complejos, escalar a enormes bibliotecas de archivos y mostrar exactamente de dónde proviene una respuesta son increíblemente útiles en entornos de alto riesgo. Estos sistemas:

Comprenden el contenido enriquecido de los documentos, yendo más allá del simple scraping de texto para capturar información de gráficos, tablas, figuras y páginas de idiomas mixtos, y tratar los documentos como lo haría un ser humano reconociendo la estructura, las relaciones y el contexto.
Gestionan grandes cantidades de datos cambiantes, absorben y procesan enormes colecciones de documentos en paralelo, y mantienen las bases de conocimiento actualizadas de forma continua.
Encuentran exactamente lo que necesitan los usuarios, ayudando a los agentes de IA a identificar los pasajes, tablas o párrafos más relevantes para una consulta y así responder con precisión y exactitud.
Demuestran la evidencia que hay detrás de las respuestas proporcionando citas a páginas o gráficos específicos para que los equipos puedan obtener transparencia y auditabilidad, algo fundamental en los sectores regulados.

El resultado es un cambio de los archivos documentales estáticos a sistemas de conocimiento vivo que impulsan directamente la inteligencia empresarial, la experiencia del cliente y los workflows operativos.

Inteligencia Documental en el Trabajo

Los sistemas inteligentes de procesamiento documental basados en modelos NVIDIA Nemotron RAG, Nemotron Parse y computación acelerada ya están transformando la forma en que las empresas de todos los sectores obtienen conocimientos de sus documentos.

Justt: Gestión de Contracargos y Optimización de Disputas con IA Nativa

En los servicios financieros, las disputas de pagos generan una pérdida significativa de ingresos y complejidad operativa para los comerciantes, en gran parte porque la evidencia necesaria para gestionarlas se encuentra en formatos no estructurados. Los registros de transacciones, las comunicaciones con clientes y los documentos de política suelen estar fragmentados entre sistemas y difíciles de procesar a gran escala, lo que hace que la gestión de disputas sea lenta, manual y costosa.

Justt.ai proporciona una plataforma impulsada por IA que automatiza el ciclo de vida completo de la devolución de cargos a gran escala. La plataforma se conecta directamente con proveedores de servicios de pago y fuentes de datos de comerciantes para obtener datos de transacciones, interacciones con clientes y políticas, y luego reúne automáticamente pruebas específicas de disputas que se ajustan a los requisitos de la red de tarjetas y del emisor.

La optimización de disputas impulsada por IA de la plataforma, impulsada por Nemotron Parse, aplica análisis predictivos para determinar qué devoluciones de cargo luchar o aceptar, y cómo optimizar cada respuesta para lograr la máxima recuperación neta. Operadores líderes en hostelería como HEI Hotels & Resorts utilizan la plataforma para automatizar la gestión de disputas en sus propiedades, recuperando ingresos mientras mantienen las relaciones con los huéspedes.

Al combinar inteligencia centrada en documentos con la automatización de decisiones, los comerciantes pueden recuperar una parte significativa de los ingresos perdidos por devoluciones de cargo ilegítimas, reduciendo al mismo tiempo el esfuerzo de revisión manual.

Docusign: Inteligencia Sobre Acuerdos de Escalado

Docusign es el líder mundial en Gestión Inteligente de Acuerdos, gestionando millones de transacciones cada día para más de 1,8 millones de clientes y más de 1.000 millones de usuarios.

Los acuerdos son la base de cualquier negocio, pero la información crítica que contienen suele estar enterrada en páginas de documentos. Para sacar a la luz la información, Docusign necesitaba una extracción de alta fidelidad de tablas, textos y metadatos de documentos complejos como PDFs, para que las empresas pudieran comprender y actuar más rápido sobre obligaciones, riesgos y oportunidades.

Docusign está evaluando Nemotron Parse para una comprensión más profunda de los contratos a gran escala. Funcionando en GPUs NVIDIA, el modelo combina IA avanzada con detección de layout y OCR. El sistema puede interpretar de forma fiable tablas complejas y reconstruir tablas con la información requerida. Esto reduce la necesidad de correcciones manuales y ayuda a garantizar que incluso los contratos más complejos se procesen con la rapidez y precisión que sus clientes esperan.

Con esta base, Docusign transformará los repositorios de acuerdos en datos estructurados que impulsarán la búsqueda de contratos, el análisis y los workflows impulsados por IA, convirtiendo acuerdos en activos empresariales que ayudan a las emopresas y sus equipos a mejorar la visibilidad, reducir riesgos y tomar decisiones más rápidas.

Edison Scientific: Investigación a Escala Literaria Masiva

Kosmos AI Scientist de Edison Scientific ayuda a los investigadores a navegar por entornos científicos complejos para sintetizar literatura, identificar conexiones y obtener evidencia superficial.

Edison necesitaba una forma de extraer información estructurada de forma rápida y precisa de grandes volúmenes de PDFs, incluyendo ecuaciones, tablas y figuras que los métodos tradicionales de análisis de información a menudo no manejan bien.

Al integrar el modelo NVIDIA Nemotron Parse en su pipeline PaperQA2, Edison puede descomponer artículos de investigación, indexar conceptos clave y respuestas en el terreno en pasajes específicos, mejorando tanto el rendimiento como la calidad de las respuestas para los científicos. Este enfoque convierte un extenso corpus de investigación en un motor de conocimiento interactivo y consultable que acelera la generación de hipótesis y la revisión de la literatura.

La alta eficiencia de Nemotron Parse permite un servicio rentable a gran escala, permitiendo al equipo de Edison desbloquear toda la cadena multimodal.

Diseñando Una Aplicación Inteligente de Procesamiento Documental con Tecnologías de NVIDIA

Una pipeline robusta y específica de inteligencia documental requiere tecnologías que puedan gestionar la extracción, incrustación y reclasificación de datos, manteniendo los datos seguros y cumpliendo con la normativa.

Extracción: extracción de Nemotron y modelos OCR para alaisar rápidamente PDFs multimodales, texto, tablas, gráficos e imágenes para convertirlos en contenido estructurado y legible por máquina, preservando el diseño y la semántica.
Incrustación: modelos de incrustación de Nemotron para convertir pasajes, entidades y elementos visuales en representaciones vectoriales ajustadas para la recuperación de documentos, lo que permite una búsqueda semánticamente precisa.
Reclasificación: modelos de reclasificación de Nemotron para evaluar los pasajes candidatos para asegurarte de que el contenido más relevante se presenta como contexto para grandes modelos de lenguaje(LLMs), mejorando la fidelidad de las respuestas y reduciendo las alucinaciones.
Análisis sintáctico: los modelos Nemotron Parse descifran la semántica de documentos para extraer texto y tablas con una base espacial precisa y un flujo de lectura correcto. Superando la variabilidad del diseño, convierten documentos no estructurados en datos accionables que mejoran la precisión de los LLMs y los workflows basados en agentes.

Estas capacidades se presentan como los microservicios NVIDIA NIM y modelos base que funcionan eficientemente en GPUs NVIDIA, permitiendo a los equipos escalar desde la prueba de concepto hasta la producción manteniendo los datos sensibles dentro de su entorno de nube o data center elegido.

Los sistemas de IA más efectivos utilizan una mezcla de modelos de vanguardia y modelos de código abierto como NVIDIA Nemotron, con un router LLM que analiza cada tarea y selecciona automáticamente el modelo más adecuado para ella. Este enfoque mantiene un rendimiento sólido mientras gestiona los costes de computación y mejora la eficiencia.

Empieza con NVIDIA Nemotron

Accede a un tutorial paso a paso sobre cómo construir un pipeline de procesamiento de documentos con capacidades RAG. Descubre cómo Nemotron RAG puede alimentar agentes especializados adaptados a diferentes industrias.

Además, experimenta con modelos Nemotron RAG y la biblioteca abierta NVIDIA NeMo Retriever, disponible en GitHub y Hugging Face, así como Nemotron Parse en Hugging Face.

Únete a la comunidad de desarrolladores que construyen con el NVIDIA Blueprint for Enterprise RAG, confiable por una docena de proveedores líderes en la industria de Plataformas de Datos de IA y disponible ya en build.nvidia.com, GitHub y el catálogo NGC.