En el acelerado entorno empresarial actual, brindar un servicio al cliente excepcional ya no es solo algo agradable, sino una necesidad. Ya sea abordando problemas técnicos, resolviendo preguntas de facturación o proporcionando actualizaciones del servicio, los clientes esperan respuestas rápidas, precisas y personalizadas a su conveniencia. Sin embargo, lograr este nivel de servicio conlleva importantes desafíos.
Los enfoques heredados, como los scripts estáticos o los procesos manuales, a menudo se quedan cortos cuando se trata de brindar soporte personalizado y en tiempo real. Además, muchas operaciones de servicio al cliente se basan en datos confidenciales y fragmentados, que están sujetos a estrictas regulaciones de privacidad y gobernanza de datos. Con el auge de la IA generativa, las empresas pretenden revolucionar el servicio al cliente mejorando la eficiencia operativa, reduciendo los costes y maximizando el retorno de la inversión.
La integración de la IA en los sistemas existentes presenta desafíos relacionados con la transparencia, la precisión y la seguridad, lo que puede impedir la adopción e interrumpir los workflows. Para superar estos obstáculos, las empresas están aprovechando los asistentes virtuales impulsados por IA generativa para gestionar una amplia gama de tareas, mejorando en última instancia los tiempos de respuesta y liberando recursos.
Esta publicación describe cómo los desarrolladores pueden usar el NVIDIA AI Blueprint para asistentes virtuales de IA para escalar operaciones con IA generativa. Al aprovechar esta información, incluido el código de muestra, las empresas pueden satisfacer las crecientes demandas de un servicio al cliente excepcional y, al mismo tiempo, garantizar la integridad y la gobernanza de los datos. Ya sea mejorando los sistemas existentes o creando otros nuevos, este plan permite a los equipos satisfacer las necesidades de los clientes con interacciones eficientes y significativas.
Asistentes Virtuales de IA Más Inteligentes con un Motor de Consultas de IA Mediante Generación de Recuperación Aumentada
Al crear un asistente virtual de IA, es importante alinearse con los requisitos únicos del caso de uso, el conocimiento institucional y las necesidades de la organización. Sin embargo, los bots tradicionales a menudo se basan en frameworks rígidos y métodos obsoletos que luchan por satisfacer las demandas cambiantes del panorama actual del servicio al cliente.
En todas las industrias, los asistentes basados en IA pueden ser transformadores. Por ejemplo, las empresas de telecomunicaciones, y la mayoría de los proveedores minoristas y de servicios, pueden utilizar los asistentes virtuales de IA para mejorar la experiencia del cliente ofreciendo soporte las 24 horas del día, los 7 días de la semana, mientras manejan una amplia gama de consultas de clientes en varios idiomas y proporcionan interacciones dinámicas y personalizadas que agilizan la resolución de problemas y la gestión de cuentas. Esto ayuda a reducir los tiempos de espera y garantiza un servicio coherente en las diversas necesidades de los clientes.
Otro ejemplo es dentro de la industria de pagadores de seguros en el área de salud, donde es fundamental garantizar una experiencia positiva de los miembros. Los asistentes virtuales mejoran esta experiencia al brindar apoyo personalizado a los miembros, abordando sus reclamos, consultas de cobertura, beneficios y problemas de pago, al tiempo que garantizan el cumplimiento de las regulaciones del área de la salud. Esto también ayuda a reducir la carga administrativa de los trabajadores del área de la salud.
Con la plataforma de IA de NVIDIA, las organizaciones pueden crear un motor de consultas de IA que utilice la generación aumentada de recuperación (RAG) para conectar las aplicaciones de IA con los datos empresariales. El proyecto de asistente virtual de IA permite a los desarrolladores comenzar rápidamente a crear soluciones que brindan experiencias mejoradas a los clientes. Se crea utilizando los siguientes microservicios NVIDIA NIM:
- NVIDIA NIM para LLM: Lleva la potencia de los grandes modelos de lenguaje (LLM) de última generación a las aplicaciones, proporcionando un procesamiento de lenguaje natural inigualable con una eficiencia notable.
- Llama 3.1 70B Instruct NIM: Impulsa conversaciones complejas con una comprensión contextual, razonamiento y generación de texto superiores.
- NVIDIA NeMo Retriever NIM: Esta colección proporciona un fácil acceso a modelos de última generación que sirven como bases fundamentales para los pipelines de RAG. Estes pipelines, cuando se integran en soluciones de asistente virtual, permiten un acceso sin interrupciones a los datos empresariales, desbloqueando el conocimiento institucional a través de respuestas rápidas, precisas y escalables.
- NeMo Retriever Embedding NIM: Aumenta el rendimiento de la recuperación de preguntas y respuestas de texto, proporcionando incrustaciones de alta calidad para el asistente virtual posterior.
- NeMo Retriever Reranking NIM: Mejora aún más el rendimiento de la recuperación con un reranker afinado, encontrando los pasajes más relevantes para proporcionar como contexto al consultar un LLM.
El plan está diseñado para integrarse a la perfección con las aplicaciones de servicio al cliente existentes sin romper los mandatos de seguridad de la información. Gracias a la portabilidad de NVIDIA NIM, las organizaciones pueden integrar datos dondequiera que residan. Al llevar la IA generativa a los datos, esta arquitectura permite a los asistentes virtuales de IA ofrecer experiencias más personalizadas y adaptadas a cada cliente aprovechando sus perfiles únicos, historiales de interacción de usuario y otros datos relevantes.
Un plano es un punto de partida que se puede personalizar para el caso de uso único de una empresa. Por ejemplo, integre otros microservicios de NIM, como el Nemotron 4 Hindi 4B Instruct, para permitir que un asistente virtual de IA se comunique en el idioma local. Otros microservicios pueden habilitar capacidades adicionales, como la generación de datos sintéticos y el ajuste fino de modelos, para alinearse mejor con los requisitos específicos de su caso de uso. Proporcione al asistente virtual de IA una interfaz similar a la humana cuando se conecte al Blueprint de IA de humano digital.
Con la implementación de un backend RAG con datos propios (tanto el perfil de la empresa y del usuario como sus datos específicos), el asistente virtual de IA puede entablar conversaciones altamente contextuales, abordando las necesidades específicas de cada cliente en tiempo real. Además, la solución opera de forma segura dentro de sus frameworks de gobernanza existentes, lo que garantiza el cumplimiento de los protocolos de privacidad y seguridad, especialmente cuando se trabaja con datos confidenciales.
Tres Bases para Crear Tu Propio Asistente Virtual de IA
Como desarrollador, puede crear su propio asistente virtual de IA que recupere la información más relevante y actualizada, en tiempo real, con respuestas humanas cada vez mejores. La Figura 1 muestra el diagrama de arquitectura del asistente virtual de IA que incluye tres componentes funcionales.

1. Pipelines de Ingesta y Recuperación de Datos
Los administradores de pipelines usan el pipeline de ingesta para cargar datos estructurados y no estructurados en las bases de datos. Algunos ejemplos de datos estructurados son los perfiles de los clientes, el historial de pedidos y el estado de los mismos. Los datos no estructurados incluyen manuales de productos, el catálogo de productos y material de apoyo, como documentos de preguntas frecuentes.
2. Agente de IA
El asistente virtual de IA es el segundo componente funcional. Los usuarios interactúan con el asistente virtual a través de una interfaz de usuario. Un agente de IA, implementado en el framework de programación LLM agentico de LangGraph, planifica cómo manejar consultas complejas de los clientes y las resuelve de forma recursiva. El agente de LangGraph utiliza la función de llamada a herramientas de Llama 3.1 70B Instruct NIM para recuperar información de las fuentes de datos estructuradas y no estructuradas y, a continuación, genera una respuesta precisa.
El agente de IA también utiliza funciones de memoria a corto y largo plazo para habilitar el historial de conversaciones de varios turnos. Las consultas y respuestas de la conversación activa se incrustan para que se puedan recuperar más adelante en la conversación como contexto adicional. Esto permite interacciones más humanas y elimina la necesidad de que los clientes repitan la información que ya han compartido con el agente.
Finalmente, al final de la conversación, el agente de IA resume la discusión junto con una determinación de sentimiento y almacena el historial de conversaciones en la base de datos estructurada. Las interacciones posteriores del mismo usuario se pueden recuperar como contexto adicional en futuras conversaciones. El resumen de llamadas y la recuperación del historial de conversaciones pueden reducir el tiempo de llamada y mejorar la experiencia del cliente. La determinación del sentimiento puede proporcionar información valiosa al administrador del servicio de atención al cliente con respecto a la eficacia del agente.
3. Pipeline de Operaciones
El pipeline de operaciones del cliente es el tercer componente funcional de la solución general. Este pipeline proporciona información y conocimientos importantes a los operadores de servicio al cliente. Los administradores pueden usar el pipeline de operaciones para revisar el historial de chat, los comentarios de los usuarios, los datos de análisis de sentimientos y los resúmenes de llamadas. El microservicio de análisis, que aprovecha el Llama 3.1 70B Instruct NIM, se puede utilizar para generar análisis como el tiempo medio de llamada, el tiempo de resolución y la satisfacción del cliente. Los análisis también se aprovechan como comentarios de los usuarios para volver a entrenar los modelos de LLM para mejorar la precisión.
Puedes encontrar el ejemplo completo de cómo empezar a utilizar este Blueprint en el repositorio de GitHub de NVIDIA AI Blueprint.
Pasa a la Producción con los Socios de NVIDIA
Los socios consultores de NVIDIA están ayudando a las empresas a adoptar asistentes virtuales de IA de clase mundial creados con la computación acelerada de NVIDIA y el software NVIDIA AI Enterprise, que incluye NeMo, microservicios NIM y AI Blueprints.
Accenture
Accenture AI Refinery, basada en NVIDIA AI Foundry, ayuda a diseñar interacciones autónomas y orientadas a la intención de los clientes, lo que permite a las empresas adaptar el viaje al individuo a través de canales innovadores, como humanos digitales o agentes de interacción. Los casos de uso específicos se pueden adaptar para satisfacer las necesidades de cada industria, por ejemplo, centros de llamadas de telecomunicaciones, asesores de pólizas de seguros, agentes interactivos farmacéuticos o agentes de redes de concesionarios de automóviles.
Deloitte
Deloitte Frontline AI mejora la experiencia de servicio al cliente con avatares digitales y agentes de LLM creados con NVIDIA AI Blueprints que son acelerados por tecnologías de NVIDIA como NVIDIA ACE, NVIDIA Omniverse, NVIDIA Riva y NIM.
Wipro
Wipro Enterprise Generative AI (WeGA) Studio acelera los casos de uso específicos de la industria, incluidos los agentes de centros de contacto en ára de la salud, servicios financieros, comercio minorista y más.
Tech Mahindra
Tech Mahindra está aprovechando el NVIDIA AI Blueprint para humanos digitales para crear soluciones para el servicio al cliente. Con RAG y NVIDIA NeMo, la solución ofrece a un aprendiz la posibilidad de detener a un agente durante una conversación levantando la mano para hacer preguntas aclaratorias. El sistema está diseñado para conectarse con microservicios en el backend con un sistema de gestión de aprendizaje refinado que se puede implementar en muchos casos de uso de la industria.
Infosys
Infosys Cortex, parte de Infosys Topaz, es una plataforma de interacción con el cliente impulsada por IA que integra NVIDIA AI Blueprints y las tecnologías NVIDIA NeMo, Riva y ACE para IA generativa, IA de voz y capacidades humanas digitales para brindar asistencia especializada e individualizada, proactiva y bajo demanda a cada miembro de una organización de servicio al cliente, por lo que desempeña un papel fundamental en la mejora de la experiencia del cliente, mejorar la eficiencia operativa y reducir los costos.
Tata Consultancy Services
El agente virtual de Tata Consultancy Services (TCS), impulsado por NVIDIA NIM e integrado con el agente virtual de TI de ServiceNow, está diseñado para optimizar el soporte de TI y RRHH. Esta solución utiliza el ajuste de avisos y RAG para mejorar los tiempos de respuesta, la precisión y proporcionar capacidades conversacionales de varios turnos. Los beneficios incluyen costos reducidos de la mesa de servicio, menos tickets de soporte, mejor utilización del conocimiento, implementación más rápida y una mejor experiencia general de los empleados y clientes.
Quantiphi
Quantiphi está integrando NVIDIA AI Blueprints en sus soluciones de IA conversacional para mejorar el servicio al cliente con avatares digitales realistas. Estos avatares de última generación, impulsados por las tecnologías NVIDIA Tokkio y ACE, los microservicios NVIDIA NIM y NVIDIA NeMo, se integran a la perfección con las aplicaciones empresariales existentes, mejorando las operaciones y las experiencias de los clientes con mayor realismo. Las implementaciones de NIM ajustadas para los workflows de avatares digitales han demostrado ser muy rentables, lo que reduce el gasto empresarial en tokens.
SoftServe
SoftServe Digital Concierge, acelerado por NVIDIA AI Blueprints y los microservicios NVIDIA NAM, utiliza NVIDIA ACE, NVIDIA Riva y el microservicio NVIDIA Audio2Face NIM para ofrecer un asistente virtual altamente realista. Gracias a la herramienta Creador de Personajes, ofrece el habla y las expresiones faciales con una precisión notable y un detalle realista.
Con las capacidades RAG de NVIDIA NeMo Retriever, SoftServe Digital Concierge puede responder de manera inteligente a las consultas de los clientes haciendo referencia al contexto y brindando información específica y actualizada. Simplifica las consultas complejas en respuestas claras y concisas y también puede proporcionar explicaciones detalladas cuando sea necesario.
EXL
La oferta Smart Agent Assist de EXL es una solución de IA para centros de contacto que aprovecha los microservicios de NVIDIA Riva, NVIDIA NeMo y NVIDIA NAM. EXL planea aumentar su solución utilizando NVIDIA AI Blueprint para agentes virtuales de IA.
En NVIDIA AI Summit India, los socios consultores de NVIDIA anunciaron una colaboración con NVIDIA para transformar India en una oficina principal para la IA. Con las tecnologías de NVIDIA, estos gigantes de la consultoría pueden ayudar a los clientes a adaptar el modelo del agente de servicio al cliente para crear asistentes virtuales únicos utilizando su modelo de IA preferido, incluidos los LLM soberanos de los fabricantes de modelos con sede en la India, y ejecutarlo en producción de manera eficiente en la infraestructura de su elección.
Comenzar
Para probar el plano de forma gratuita y ver los requisitos del sistema, vaya a Blueprint Card.
Para comenzar a crear aplicaciones con esos microservicios, visite el catálogo de API de NVIDIA. Para iniciar sesión, se le pedirá que ingrese una dirección de correo electrónico personal o comercial para acceder a diferentes opciones para crear con NIM. Para obtener más información, consulte las preguntas frecuentes sobre NVIDIA NIM.