Avance de la IA de Producción con NVIDIA AI Enterprise

por Phoebe Lee

Si bien aprovechar el potencial de la IA es una prioridad para muchas de las empresas actuales, desarrollar e implementar un modelo de IA implica tiempo y esfuerzo. A menudo, se deben superar los desafíos para llevar un modelo a producción, especialmente para las operaciones comerciales de misión crítica. Según un estudio de IDC, solo el 18% de las empresas encuestadas podrían poner en producción un modelo de IA en menos de un mes.

Esta publicación explora los desafíos que ralentizan las implementaciones de IA y presenta los beneficios de usar una plataforma consistente, segura y confiable para acelerar el viaje de llevar la IA a la producción.

La Complejidad Cada Vez Mayor de la Pila de Software de IA

El software de código abierto (OSS) desempeña un papel fundamental en el avance de la adopción de la IA. Según The State of the Octoverse 2023, en 2023 hubo 65 mil proyectos públicos de GitHub relacionados con la IA generativa con un crecimiento interanual del 248%. Si bien la comunidad de código abierto ha ayudado a impulsar la era de la IA, la diversa gama de OSS utilizados en la creación de aplicaciones de IA hace que mantener una pila de software de IA confiable y de nivel empresarial sea una tarea compleja y que requiere muchos recursos que es similar al mantenimiento de un sistema operativo de código abierto.

Por ejemplo, el Servidor de Inferencia NVIDIA Triton, que se utiliza para estandarizar y escalar las implementaciones de IA, se basa en innumerables dependencias de software. En la figura 1, los puntos verdes representan las bibliotecas CUDA, los puntos blancos representan los paquetes OSS y las líneas intermedias representan las dependencias. Cualquier cambio, como una actualización de software regular o un parche de seguridad, puede introducir un cambio en la API y provocar un error o un tiempo de inactividad de la aplicación.

A graphic representation of NVIDIA Triton Inference Server software dependencies. Green dots represent CUDA libraries, white dots represent OSS packages, and the lines in between represent dependencies.
Figura 1.  Dependencias de software de Servidor de Inferencia NVIDIA Triton

Monitoreo Continuo de la Seguridad

El inevitable aumento de las vulnerabilidades de seguridad hace que el mantenimiento de la pila de software de IA sea aún más difícil. Un reciente informe de análisis de riesgos y seguridad de código abierto de Synopsys indica un aumento del 236% en los patrones de ataque de alto riesgo en las vulnerabilidades de OSS para big data, IA, business intelligent y machine learning durante un período de 5 años.

Constantemente se descubren nuevas vulnerabilidades. Por ejemplo, en la Figura 2 se muestra una comparación de los resultados del análisis de seguridad para el contenedor NVIDIA Triton. En poco más de 3 semanas, se identificó una vulnerabilidad crítica. Además, el número de vulnerabilidades altas creció de cuatro a 11. La supervisión continua y los tiempos de respuesta rápidos para corregir las vulnerabilidades son fundamentales para mantener la continuidad del negocio.

Two screenshots showing that the vulnerabilities of NVIDIA Triton increased in 3 weeks.
Figura 2. Comparación de los resultados del análisis de seguridad para NVIDIA Triton

NVIDIA AI Enterprise para IA de Producción

Para ayudar a abordar estos desafíos, NVIDIA presentó NVIDIA AI Enterprise, una plataforma de software nativa de la nube de extremo a extremo que acelera los pipelines de ciencia de datos y agiliza el desarrollo y la implementación de IA de nivel de producción.  Basada en código abierto y seleccionada, optimizada y respaldada por NVIDIA, la plataforma de software NVIDIA AI Enterprise permite a los desarrolladores centrarse en la creación e implementación de nuevos servicios de IA.

NVIDIA AI Enterprise incluye tres ramas compatibles: ramas de producción, ramas de funciones y ramas de soporte a largo plazo. Los clientes tienen acceso a las tres sucursales y pueden utilizar cualquier combinación de las tres.

Las ramas de producción garantizan la estabilidad de la API y las actualizaciones de seguridad periódicas; ideal para implementar la IA en producción cuando se requiere estabilidad. Se lanza cada 6 meses con un ciclo de vida de 9 meses.

Las ramas de características incluyen las actualizaciones de software de la parte superior del árbol; ideal para desarrolladores de IA que desean un entorno de desarrollo más rápido y más reciente. Se publica mensualmente.

Las ramas de soporte a largo plazo son ideales para industrias altamente reguladas. Se lanza cada 2,5 años con un ciclo de vida de hasta 3 años.

Estabilidad y Seguridad de la API

A lo largo del ciclo de vida de 9 meses de cada rama de producción de NVIDIA AI Enterprise, NVIDIA supervisa continuamente las vulnerabilidades y exposiciones comunes (CVE) críticas y altas y publica parches de seguridad mensuales (Figura 3). De este modo, los marcos, las bibliotecas, los modelos y las herramientas de IA incluidos en NVIDIA AI Enterprise pueden actualizarse para realizar correcciones de seguridad, al tiempo que se elimina el riesgo de que se rompa una API.

Graphic of NVIDIA AI Enterprise production branch lifecycle timeline.
Figura 3. Cronología del ciclo de vida de la rama de producción de NVIDIA AI Enterprise

En la Figura 4 se compara la versión de Triton disponible a través de la versión de la rama de producción de NVIDIA AI Enterprise con la versión de código abierto de Triton. La versión comercial disponible con la rama de producción de NVIDIA AI Enterprise tiene cero vulnerabilidades críticas y altas, mientras que la versión de código abierto tiene nueve vulnerabilidades altas.

Two screenshots of vulnerability scanning results of two PyTorch images. One from NGC, and one from NVIDIA AI Enterprise.
Figura 4. Comparación de los resultados del análisis de seguridad de Triton

Seguridad A Través de la Transparencia

Además de las ramas de productos con parches CVE mensuales y correcciones de errores, los clientes de NVIDIA AI Enterprise también pueden recibir avisos de seguridad e información de explotabilidad de NVIDIA, incluido el intercambio de vulnerabilidades (VEX) y la lista de materiales de software (SBOM), el contexto de vulnerabilidades y la guía de corrección.

Un documento VEX es una adición relativamente reciente al campo de la ciberseguridad. A diferencia de una entrada CVE, que proporciona información general sobre una vulnerabilidad, un documento VEX proporciona mediante programación detalles importantes específicos del contexto. Indica si una vulnerabilidad es relevante (o explotable) para determinados componentes de la pila de IA. También se utiliza para comunicar falsos positivos marcados por herramientas de análisis de vulnerabilidades. Los documentos VEX en NVIDIA se entregan en formato CyclonDX, que proporciona una forma estandarizada legible por máquina de compartir la información con los clientes.

Optimización del Software a lo Largo del Tiempo para un Mejor Rendimiento y un Menor Coste Total de Propiedad

A medida que NVIDIA continúa evolucionando el software de IA y optimizando el rendimiento a lo largo del tiempo, los avances en el software de IA de NVIDIA ofrecen hasta un 54% de ganancias de rendimiento sin una actualización de hardware. En la figura 5 se muestran los resultados de envío de NVIDIA MLPerf Inference v3.0 en comparación con v2.1 con GPU NVIDIA H100. Esto no solo mejora la eficiencia y el rendimiento, sino que también reduce el consumo de energía, la huella y la inversión en el data center o la nube.

Chart of NVIDIA MLPerf Inference v3.0 compared to v2.1 submission results on NVIDIA H100.
Figura 5. El software de inferencia de NVIDIA ofrece hasta un 54% de aumento de rendimiento sin necesidad de actualizar el hardware

Soporte para Empresas

El soporte empresarial se incluye con cada suscripción a NVIDIA AI Enterprise, lo que permite a las organizaciones beneficiarse de la transparencia del código abierto con la garantía de soporte completo de la pila de software proporcionado por NVIDIA. El soporte estándar para empresas incluye:

  • Se aceptan casos de soporte técnico ilimitados a través del portal del cliente y teléfono a tiempo completo
  • Soporte de escalamiento durante el horario comercial local
  • Resolución oportuna por parte de los expertos e ingenieros de NVIDIA
  • Hasta 3 años de soporte a largo plazo

Ya sea que necesites conectarte con expertos en IA, acceder a los recursos de la base de conocimientos o solucionar problemas de rendimiento, NVIDIA está aquí para ayudarte y brindarte el soporte que necesitas para mantener tu IA estable y segura.

Primeros Pasos con NVIDIA AI Enterprise

NVIDIA AI Enterprise reduce los costes y la carga de mantener y proteger la compleja plataforma de software para la IA de producción, lo que libera a las organizaciones para que se centren en la creación de IA y en el aprovechamiento de sus conocimientos innovadores.

Para experimentar la plataforma empresarial, solicite una licencia de evaluación gratuita de 90 días que otorgue acceso a todas las ramas de software y soporte empresarial.

¿Ya eres usuario de NVIDIA AI Enterprise? Acceda a la última versión de la rama de producción.