Gracias a los rápidos avances tecnológicos, los consumidores se han acostumbrado a un nivel de comodidad y eficiencia sin precedentes.
Los teléfonos inteligentes hacen que sea más fácil que nunca buscar un producto y recibirlo directamente en la puerta principal. La tecnología de video chat permite que amigos y familiares de diferentes continentes se conecten con facilidad. Con herramientas de comando de voz, los asistentes de IA pueden reproducir canciones, iniciar llamadas telefónicas o recomendar la mejor comida italiana en un radio de 10 millas. Los algoritmos de inteligencia artificial pueden incluso predecir qué programa los usuarios querrán ver a continuación o sugerir un artículo que quizás quieran leer antes de realizar una compra.
No sorprende, entonces, que los clientes esperen interacciones rápidas y personalizadas con las empresas. Según un informe de investigación de Salesforce , el 83% de los consumidores espera un compromiso inmediato cuando se comunican con una empresa, mientras que el 73% espera que las empresas comprendan sus necesidades y expectativas únicas. Casi el 60% de todos los clientes quieren evitar el servicio de atención al cliente por completo y prefieren resolver los problemas con funciones de autoservicio.
Cumplir con expectativas tan altas de los consumidores supone una carga enorme para las empresas de todos los sectores, incluido su personal y sus necesidades tecnológicas, pero la IA del habla puede ayudar.
La IA del habla puede comprender y conversar en lenguaje natural, creando oportunidades para interacciones fluidas y multilingües con los clientes, al tiempo que complementa las capacidades de los empleados. Puede impulsar la banca de autoservicio en la industria de servicios financieros , habilitar avatares en quioscos de comida en restaurantes , transcribir notas clínicas en centros de salud o agilizar el pago de facturas para empresas de servicios públicos , ayudando a empresas de todos los sectores a ofrecer experiencias personalizadas a sus clientes.
IA del habla para banca y pagos
La mayoría de las personas ahora utilizan canales digitales y tradicionales para acceder a los servicios bancarios, lo que genera una demanda de atención al cliente personalizada y omnicanal. Sin embargo, la mayor demanda de soporte, junto con una alta tasa de abandono de agentes, ha dejado a muchas instituciones financieras luchando por mantenerse al día con las necesidades de servicio y soporte de sus clientes.
Las frustraciones comunes de los consumidores incluyen dificultades con procesos digitales complejos, falta de información útil y fácilmente disponible, opciones de autoservicio insuficientes, largos tiempos de espera en las llamadas y dificultades de comunicación con los agentes de soporte.
Según una encuesta reciente de NVIDIA , los principales casos de uso de IA para instituciones de servicios financieros son el procesamiento del lenguaje natural (NLP) y los modelos de lenguaje grandes (LLM) . Estos modelos automatizan las interacciones de servicio al cliente y procesan grandes cantidades de datos financieros no estructurados para proporcionar información basada en inteligencia artificial que respalde todas las líneas de negocios en las instituciones financieras, desde la gestión de riesgos y la detección de fraude hasta el comercio algorítmico y el servicio al cliente.
Al ofrecer opciones de autoservicio equipadas con voz y apoyar a los agentes de servicio al cliente con asistentes virtuales con tecnología de inteligencia artificial, los bancos pueden mejorar las experiencias de los clientes y, al mismo tiempo, controlar los costos. Los asistentes de voz de IA pueden recibir capacitación sobre vocabulario financiero específico y técnicas de reformulación para confirmar la comprensión de la solicitud de un usuario antes de ofrecer respuestas.
Kore.ai , una empresa de software de inteligencia artificial conversacional, capacitó su solución BankAssist en más de 400 casos de uso de banca minorista para canales de respuesta de voz interactiva, web, móvil, SMS y redes sociales. Los clientes pueden utilizar un asistente de voz para transferir fondos, pagar facturas, informar tarjetas perdidas, disputar cargos, restablecer contraseñas y más.
El asistente de voz del agente de Kore.ai también ayuda a los agentes en vivo a brindar sugerencias personalizadas para que puedan resolver problemas más rápido. Se ha demostrado que la solución mejora la eficiencia de los agentes en vivo al reducir el tiempo de atención al cliente en un 40 % con un retorno de la inversión de $2,30 por sesión de voz .
Con tales tendencias, se espera que las instituciones financieras aceleren la implementación de la inteligencia artificial del habla para agilizar la atención al cliente y reducir los tiempos de espera, ofrecer más opciones de autoservicio, transcribir llamadas para acelerar el procesamiento de préstamos y automatizar el cumplimiento, extraer información del contenido hablado y aumentar la productividad general. y rapidez de las operaciones.
IA del habla para telecomunicaciones
Las fuertes inversiones en infraestructura 5G y la competencia feroz para monetizar y lograr retornos rentables en nuevas redes significan que mantener la satisfacción del cliente y la lealtad a la marca es primordial en la industria de las telecomunicaciones.
Según una encuesta de NVIDIA realizada a más de 400 profesionales de la industria, los principales casos de uso de IA en la industria de las telecomunicaciones implican optimizar las operaciones de red y mejorar las experiencias de los clientes. El setenta y tres por ciento de los encuestados reportaron mayores ingresos provenientes de la IA.
Al utilizar tecnologías de inteligencia artificial del habla para impulsar chatbots, enrutamiento de llamadas, funciones de autoservicio y sistemas de recomendación, las empresas de telecomunicaciones pueden mejorar y personalizar la interacción con los clientes.
KT, un operador de telefonía móvil de Corea del Sur con más de 22 millones de usuarios, ha creado GiGa Genie, un asistente de voz inteligente que ha sido capacitado para comprender y utilizar el idioma coreano mediante LLM. Ya ha hablado con más de 8 millones de usuarios.
Al comprender los comandos de voz, el altavoz GiGA Genie AI puede ayudar a las personas con tareas como encender televisores o luces inteligentes, enviar mensajes de texto o proporcionar actualizaciones de tráfico en tiempo real.
KT también ha fortalecido su Centro de Atención al Cliente impulsado por IA con modelos de IA de voz basados en transformadores que pueden manejar de forma independiente más de 100.000 llamadas por día. Un componente de IA generativa del sistema responde de forma autónoma a los clientes con sugerencias de resolución o las transfiere a agentes humanos para preguntas y soluciones más matizadas.
Se espera que las empresas de telecomunicaciones se apoyen en la IA del habla para desarrollar más capacidades de autoservicio para el cliente, optimizar el rendimiento de la red y mejorar la satisfacción general del cliente.
IA del habla para restaurantes de servicio rápido
Se espera que la industria de servicios alimentarios alcance 997 mil millones de dólares en ventas en 2023 , y se prevé que su fuerza laboral crezca en 500.000 vacantes. Mientras tanto, la elevada demanda de autoservicio, recogida en la acera y entrega a domicilio sugiere un cambio permanente en las preferencias gastronómicas de los consumidores. Este cambio crea el desafío de contratar, capacitar y retener personal en una industria con tasas de rotación notoriamente altas, y al mismo tiempo satisfacer las expectativas de los consumidores de un servicio rápido y fresco.
Los asistentes de pedidos desde el auto y los quioscos de comida en las tiendas equipados con inteligencia artificial del habla pueden ayudar a aliviar la carga. Por ejemplo, los avatares equipados con voz pueden ayudar a automatizar el proceso de pedido ofreciendo recomendaciones de menú, sugiriendo promociones, personalizando opciones o pasando pedidos de comida directamente a la cocina para su preparación.
HuEx , una startup con sede en Toronto y miembro de NVIDIA Inception , ha diseñado un asistente de pedidos automatizado multilingüe para mejorar las operaciones de autoservicio. Conocido como AIDA, el asistente de IA recibe y responde a las órdenes en el altavoz del drive-thru mientras transcribe simultáneamente las órdenes de voz en texto para el personal de preparación de alimentos.
AIDA comprende más de 300.000 combinaciones de productos con un 90% de precisión , desde solicitudes comunes como «café con leche» hasta solicitudes menos comunes como «café con mantequilla». Incluso puede comprender diferentes acentos y dialectos para garantizar una experiencia de pedido perfecta para una población diversa de consumidores.
Speech AI agiliza el proceso de pedido al acelerar el cumplimiento, reducir la falta de comunicación y minimizar los tiempos de espera de los clientes. Los pioneros también comenzarán a utilizar la inteligencia artificial del habla para extraer información de los clientes a partir de las interacciones de voz para informar las opciones del menú, hacer recomendaciones de ventas adicionales y mejorar la eficiencia operativa general al tiempo que reducen los costos.
IA del habla para la atención sanitaria
En la era pospandémica, la digitalización de la atención sanitaria sigue acelerándose. La telemedicina y la visión por computadora respaldan la monitorización remota de pacientes, los sistemas clínicos activados por voz ayudan a los pacientes a registrarse y recibir atención sin contacto y la tecnología de reconocimiento de voz respalda las responsabilidades de documentación clínica. Según IDC, el 36% de los encuestados indicaron que habían implementado asistentes digitales para la atención médica de los pacientes.
Los modelos de reconocimiento de voz automatizado y PNL ahora pueden capturar, reconocer, comprender y resumir detalles clave en entornos médicos. En la Conferencia sobre inteligencia artificial en imágenes médicas, los investigadores de NVIDIA mostraron una arquitectura previamente entrenada de última generación con funcionalidad de voz a texto para extraer entidades clínicas de conversaciones médico-paciente. El modelo identifica palabras clínicas (incluidos síntomas, nombres de medicamentos, diagnósticos y tratamientos recomendados) y actualiza automáticamente los registros médicos.
Esta tecnología puede aliviar la carga de tomar notas manualmente y tiene el potencial de acelerar los procesos de facturación y seguros, al mismo tiempo que crea resúmenes de consultas para los cuidadores. Liberados de tareas administrativas, los médicos pueden centrarse en la atención al paciente para ofrecer experiencias superiores.
Artisight, una plataforma de inteligencia artificial para la atención médica , utiliza el reconocimiento de voz para impulsar los registros sin intervención y la síntesis de voz para notificar a los pacientes en la sala de espera cuando el médico está disponible. Más de 1200 pacientes por día utilizan los quioscos Artisight, que ayudan a agilizar los procesos de registro, mejorar las experiencias de los pacientes, eliminar errores de entrada de datos con la automatización y aumentar la productividad del personal.
A medida que la atención médica avanza hacia un modelo hospitalario inteligente, se espera ver que la IA del habla desempeñe un papel más importante en el apoyo a los profesionales médicos y en el impulso de experiencias de bajo contacto para los pacientes. Esto puede incluir predicción y diagnóstico de factores de riesgo mediante análisis de notas clínicas, servicios de traducción para centros de atención multilingüe, dictado y transcripción médica y automatización de otras tareas administrativas.
IA del habla para la energía
Ante la creciente demanda de energía limpia, los altos costos operativos y una fuerza laboral que se jubila en mayor número, las empresas de energía y servicios públicos están buscando formas de hacer más con menos.
Para impulsar nuevas eficiencias, prepararse para el futuro de la energía y satisfacer las expectativas cada vez mayores de los clientes, las empresas de servicios públicos pueden utilizar la inteligencia artificial del habla. El servicio de atención al cliente basado en voz puede permitir a los clientes informar interrupciones, consultar sobre facturación y recibir asistencia sobre otros problemas sin la intervención de un agente. Speech AI puede agilizar la lectura de medidores, ayudar a los técnicos de campo con notas de voz y comandos de voz para acceder a órdenes de trabajo y permitir que las empresas de servicios públicos analicen las preferencias de los clientes con PNL.
Minerva CQ, un asistente de inteligencia artificial diseñado específicamente para casos de uso de energía minorista, apoya a los agentes de servicio al cliente transcribiendo conversaciones a texto en tiempo real. El texto se introduce en los modelos de inteligencia artificial de Minerva CQ, que analizan el sentimiento, la intención, la propensión y más del cliente.
Al escuchar dinámicamente, el asistente de IA llena la pantalla de un agente con sugerencias de diálogo, señales de comportamiento, ofertas personalizadas y análisis de sentimientos. Una función de conocimiento muestra el historial de uso de energía de un cliente y sugiere opciones de descarbonización, brindando a los agentes la información necesaria para ayudar a los clientes a tomar decisiones informadas sobre su consumo de energía.
Con el asistente de IA que brinda explicaciones simples y consistentes sobre fuentes de energía, planes tarifarios, cambios de facturación y gasto óptimo, los agentes de servicio al cliente pueden guiar sin esfuerzo a los clientes hacia el plan de energía más ideal. Después de implementar Minerva CQ, un proveedor de servicios públicos informó una reducción del 44 % en el tiempo de manejo de llamadas, un aumento del 12,5 % en la resolución del primer contacto y un ahorro promedio de $2,67 por llamada.
Se espera que Speech AI continúe ayudando a los proveedores de servicios públicos a reducir los costos de capacitación, eliminar la fricción en las interacciones de servicio al cliente y equipar a los técnicos de campo con herramientas activadas por voz para aumentar la productividad y mejorar la seguridad, todo mientras se mejora la satisfacción del cliente.
IA de voz y traducción para el sector público
Debido a que los programas de servicio público a menudo carecen de fondos y personal suficientes, los ciudadanos que buscan servicios e información vitales a veces se quedan esperando y frustrados. Para abordar este desafío, algunas agencias a nivel federal y estatal están recurriendo a la inteligencia artificial para lograr una prestación de servicios más oportuna.
La Agencia Federal para el Manejo de Emergencias utiliza sistemas automatizados de reconocimiento de voz para administrar líneas directas de emergencia, analizar señales de socorro y dirigir recursos de manera eficiente. La Administración de la Seguridad Social de EE. UU. utiliza un sistema interactivo de respuesta de voz y asistentes virtuales para responder consultas sobre beneficios de seguridad social y procesos de solicitud, y para brindar información general.
El Departamento de Asuntos de Veteranos ha designado un director de IA para supervisar la integración de la tecnología en sus sistemas de atención médica. El VA utiliza tecnología de reconocimiento de voz para poder tomar notas durante las citas de telesalud. También ha desarrollado un motor avanzado de transcripción de voz automatizado para ayudar a calificar pruebas neuropsicológicas para el análisis del deterioro cognitivo en pacientes mayores.
Otras oportunidades para la IA del habla en el sector público incluyen servicios de traducción de idiomas en tiempo real para interacciones ciudadanas, eventos públicos o diplomáticos visitantes. Las agencias públicas que manejan un gran volumen de llamadas pueden beneficiarse de interfaces de voz multilingües para permitir a los ciudadanos acceder a información, realizar consultas o solicitar servicios en diferentes idiomas.
La IA de voz y traducción también puede automatizar el procesamiento de documentos al convertir grabaciones de audio multilingües o contenido hablado en texto traducido para agilizar los procesos de cumplimiento, mejorar la precisión de los datos y mejorar la eficiencia de las tareas administrativas. La IA del habla también tiene el potencial de ampliar el acceso a los servicios para personas con discapacidad visual o de movilidad.
IA del habla para automoción
Desde la venta de vehículos hasta la programación de servicios, la IA del habla puede aportar numerosos beneficios a los fabricantes de automóviles, los concesionarios, los conductores y los pasajeros por igual.
Antes de visitar un concesionario en persona, más de la mitad de los compradores de vehículos comienzan su búsqueda en línea y luego hacen el primer contacto con una llamada telefónica para recopilar información. Los chatbots de inteligencia artificial del habla entrenados en manuales de vehículos pueden responder preguntas sobre capacidades tecnológicas, navegación, seguridad, garantía, costos de mantenimiento y más. Los chatbots de IA también pueden programar pruebas de manejo, responder preguntas sobre precios e informar a los compradores qué modelos están en stock. Esto permite a los fabricantes de automóviles diferenciar sus redes de concesionarios a través de interacciones inteligentes y automatizadas con los clientes.
Los fabricantes están incorporando inteligencia artificial del habla avanzada en vehículos y aplicaciones para mejorar las experiencias de conducción, la seguridad y el servicio. Los asistentes de IA a bordo pueden ejecutar comandos de voz en lenguaje natural para navegación, información y entretenimiento, diagnóstico general del vehículo y consulta de manuales de usuario. Sin necesidad de operar controles físicos o pantallas táctiles, los conductores pueden mantener las manos en el volante y la vista en la carretera.
La IA del habla puede ayudar a maximizar el tiempo de actividad de los vehículos para flotas comerciales. La IA capacitada en boletines de servicio técnico y cadencias de actualización de software permite a los técnicos proporcionar cotizaciones de reparaciones más precisas, identificar información clave antes de subir el automóvil y proporcionar rápidamente actualizaciones de reparación de vehículos a clientes comerciales y de pequeñas empresas.
Con información obtenida de los comandos de voz del conductor y los informes de errores, los fabricantes también pueden mejorar el diseño del vehículo y el software operativo. A medida que los vehículos autónomos se vuelven más avanzados, se espera que la IA del habla desempeñe un papel fundamental en la forma en que los conductores operan los vehículos, solucionan problemas, solicitan asistencia y programan el mantenimiento.
IA del habla: de los espacios inteligentes al entretenimiento
La IA del habla tiene el potencial de impactar a casi todas las industrias.
En las ciudades inteligentes , la IA del habla se puede utilizar para gestionar llamadas de socorro y proporcionar respuestas de emergencia con información crucial. En Ciudad de México, la Oficina de las Naciones Unidas contra la Droga y el Delito está desarrollando un programa de inteligencia artificial del habla para analizar las llamadas al 911 para prevenir la violencia de género. Al analizar las llamadas de socorro, la IA puede identificar palabras clave, señales y patrones para ayudar a prevenir la violencia doméstica contra las mujeres. La IA del habla también se puede utilizar para brindar servicios multilingües en espacios públicos y mejorar el acceso al transporte público para las personas con discapacidad visual.
En la educación superior y la investigación , la IA del habla puede transcribir automáticamente conferencias y entrevistas de investigación, proporcionando a los estudiantes notas detalladas y ahorrando a los investigadores el tiempo dedicado a recopilar datos cualitativos. Speech AI también facilita la traducción de contenidos educativos a varios idiomas, aumentando su accesibilidad.
La traducción mediante IA impulsada por LLM facilita el consumo de entretenimiento y la transmisión de contenido en línea en cualquier idioma. Netflix , por ejemplo, utiliza IA para traducir automáticamente subtítulos a varios idiomas. Mientras tanto, la startup Papercup está utilizando inteligencia artificial para automatizar el doblaje de contenido de video para llegar a audiencias globales en sus idiomas locales.
Transformando las ofertas de productos y servicios con la IA del habla
En el panorama del consumidor moderno, es imperativo que las empresas brinden experiencias convenientes y personalizadas a los clientes. Las empresas pueden utilizar la PNL y las capacidades de traducción de la IA del habla para transformar la forma en que operan e interactúan con los clientes en tiempo real a escala global.
Empresas de todos los sectores están utilizando la inteligencia artificial del habla para ofrecer respuestas de servicio al cliente rápidas y multilingües, funciones de autoservicio y herramientas de información y automatización para capacitar a los empleados para que brinden experiencias de mayor valor.
Para ayudar a las empresas de todos los sectores a aprovechar los beneficios del habla, la traducción y la IA conversacional, NVIDIA ofrece un conjunto de tecnologías.
NVIDIA Riva , un kit de desarrollo de software de inteligencia artificial de voz y traducción multilingüe acelerado por GPU, impulsa canales de inteligencia artificial conversacional en tiempo real totalmente personalizables para aplicaciones de reconocimiento automático de voz, texto a voz y traducción automática neuronal.
NVIDIA Tokkio , basado en NVIDIA Omniverse Avatar Cloud Engine , ofrece servicios nativos de la nube para crear asistentes virtuales y humanos digitales que pueden actuar como agentes de servicio al cliente de IA.
Estas herramientas permiten a los desarrolladores implementar rápidamente aplicaciones de alta precisión con la velocidad de respuesta en tiempo real necesaria para experiencias superiores de empleados y clientes.
Únase al Día gratuito de la IA del habla en septiembre. 20 para escuchar a reconocidos líderes en inteligencia artificial del habla y la traducción sobre investigaciones innovadoras, aplicaciones del mundo real y contribuciones de código abierto.