En la IA empresarial, comprender y trabajar en varios idiomas ya no es opcional, sino que es esencial para satisfacer las necesidades de los empleados, clientes y usuarios de todo el mundo.
La recuperación de información multilingüe, es decir, la capacidad de buscar, procesar y recuperar conocimientos en varios idiomas, desempeña un papel clave para permitir que la IA ofrezca resultados más precisos y relevantes a nivel mundial.
Las empresas pueden expandir sus esfuerzos de IA generativa a sistemas precisos y multilingües utilizando la incorporación y reclasificación de los microservicios NVIDIA NIM de NVIDIA NeMo Retriever, que ahora están disponibles en el catálogo de API de NVIDIA. Estos modelos pueden comprender información en una amplia gama de idiomas y formatos, como documentos, para ofrecer resultados precisos y sensibles al contexto a gran escala.
Con NeMo Retriever, las empresas ahora pueden:
- Extrair conocimientos de conjuntos de datos grandes y diversos para obtener contexto adicional y ofrecer respuestas más precisas.
- Conectar sin problemas la IA generativa con los datos empresariales en la mayoría de los principales idiomas del mundo para ampliar el público de usuarios.
- Ofrecer inteligencia procesable a mayor escala con una eficiencia de almacenamiento de datos 35 veces mejorada a través de nuevas técnicas como la compatibilidad con contextos largos y el tamaño de incrustación dinámica.

Los principales socios de NVIDIA, como DataStax, Cohesity, Cloudera, Nutanix, SAP, VAST Data y WEKA, ya están adoptando estos microservicios para ayudar a las organizaciones de todos los sectores a conectar de forma segura modelos personalizados con fuentes de datos diversas y grandes. Mediante el uso de técnicas de generación aumentada de recuperación (RAG), NeMo Retriever permite a los sistemas de IA acceder a información más rica y relevante y cerrar eficazmente las brechas lingüísticas y contextuales.
Wikidata Acelera el Procesamiento de Datos de 30 Días a Menos de 3 Días
En asociación con DataStax, Wikimedia ha implementado NeMo Retriever para incrustar el contenido de Wikipedia, sirviendo a miles de millones de usuarios. La incrustación vectorial, o «vectorización», es un proceso que transforma los datos en un formato que la IA puede procesar y comprender para extraer información e impulsar la toma de decisiones inteligentes.
Wikimedia utilizó el método de incrustación de NeMo Retriever y reclasificación de los microservicios de NIM para vectorizar más de 10 millones de entradas de Wikidata en formatos listos para IA en menos de 3 días, un proceso que solía llevar 30 días. Esa aceleración 10 veces permite el acceso escalable y multilingüe a uno de los gráficos de conocimiento de código abierto más grandes del mundo.
Este innovador proyecto garantiza actualizaciones en tiempo real para cientos de miles de entradas que son editadas diariamente por miles de colaboradores, mejorando la accesibilidad global tanto para desarrolladores como para usuarios. Con el modelo sin servidor de Astra DB y las tecnologías de IA de NVIDIA, la oferta de DataStax ofrece una latencia casi nula y una escalabilidad excepcional para satisfacer las demandas dinámicas de la comunidad Wikimedia.
DataStax utiliza NVIDIA AI Blueprints e integra los microservicios NVIDIA NeMo Customizer, Curator, Evaluator y Guardrails en el creador de código LangFlow AI para permitir que el ecosistema de desarrolladores optimice los modelos y pipelines de IA para sus casos de uso únicos y ayude a las empresas a escalar sus aplicaciones de IA.
La IA Inclusiva en el Lenguaje Impulsa el Impacto Empresarial Global
NeMo Retriever ayuda a las empresas globales a superar las barreras lingüísticas y contextuales y a liberar el potencial de sus datos. Al implementar soluciones sólidas de IA, las empresas pueden lograr resultados precisos, escalables y de alto impacto.
La plataforma y los socios consultores de NVIDIA desempeñan un papel fundamental para garantizar que las empresas puedan adoptar e integrar de manera eficiente las capacidades de IA generativa, como los nuevos microservicios multilingües NeMo Retriever. Estos socios ayudan a alinear las soluciones de IA con las necesidades y los recursos únicos de una organización, lo que hace que la IA generativa sea más accesible y eficaz. Entre ellos se encuentran:
- Cloudera planea ampliar la integración de IA de NVIDIA en el servicio de inferencia de IA de Cloudera. Cloudera AI Inference, que actualmente está integrado en NVIDIA NIM, incluirá NVIDIA NeMo Retriever para mejorar la velocidad y la calidad de la información en casos de uso multilingües.
- Cohesity presentó el primer asistente de búsqueda conversacional generativo impulsado por IA de la industria que utiliza datos de respaldo para brindar respuestas perspicaces. Utiliza el microservicio de reclasificación de NVIDIA NeMo Retriever para mejorar la precisión de la recuperación y mejorar significativamente la velocidad y la calidad de la información para diversas aplicaciones.
- SAP está utilizando las capacidades de puesta a tierra de NeMo Retriever para agregar contexto a su función de preguntas y respuestas del copiloto Joule y a la información recuperada de documentos personalizados.
- VAST Data está implementando los microservicios de NeMo Retriever en VAST Data InsightEngine con NVIDIA para que los nuevos datos estén disponibles al instante para su análisis. Esto acelera la identificación de información empresarial mediante la captura y organización de información en tiempo real para tomar decisiones impulsadas por IA.
- WEKA está integrando su arquitectura WEKA AI RAG Reference Platform (WARRP) con NVIDIA NIM y NeMo Retriever en su plataforma de datos de baja latencia para ofrecer soluciones de IA escalables y multimodales, procesando cientos de miles de tokens por segundo.
Rompiendo las Barreras Lingüísticas con la Recuperación de Información Multilingüe
La recuperación de información multilingüe es vital para que la IA empresarial satisfaga las demandas del mundo real. NeMo Retriever admite la recuperación de texto eficiente y precisa en varios idiomas y conjuntos de datos multilingües. Está diseñado para casos de uso empresarial, como sistemas de búsqueda, respuesta a preguntas, resumen y recomendación.
Además, aborda un desafío importante en la IA empresarial: el manejo de grandes volúmenes de documentos de gran tamaño. Con soporte de contexto largo, los nuevos microservicios pueden procesar contratos prolongados o registros médicos detallados mientras mantienen la precisión y la coherencia en interacciones extendidas.
Estas capacidades ayudan a las empresas a utilizar sus datos de forma más eficaz, proporcionando resultados precisos y fiables para los empleados, clientes y usuarios, al tiempo que optimizan los recursos para la escalabilidad. Las herramientas avanzadas de recuperación multilingüe, como NeMo Retriever, pueden hacer que los sistemas de IA sean más adaptables, accesibles e impactantes en un mundo globalizado.
Disponibilidad
Los desarrolladores pueden acceder a los microservicios multilingües de NeMo Retriever y a otros microservicios de NIM para la recuperación de información, a través del catálogo de API de NVIDIA o una licencia de desarrollador de NVIDIA AI Enterprise de 90 días sin costo.
Obtenga más información sobre los nuevos microservicios de NeMo Retriever y cómo usarlos para crear sistemas eficientes de recuperación de información.