Miles de Millones Servidos: NVIDIA Merlin Ayuda a Impulsar los Clics para los Gigantes en Línea

Los sistemas basados en el deep learning permiten mejorar la relevancia de las recomendaciones para miles de millones de consumidores en línea.
por Scott Martin

El comercio en línea se ha disparado a billones de dólares en todo el mundo en la última década, sirviendo a miles de millones de consumidores. Detrás de escena de este crecimiento explosivo en las ventas en línea está la personalización impulsada por los motores de recomendación.

Los recomendadores hacen que las compras sean profundamente personalizadas. Mientras buscan productos en sitios de comercio electrónico, lo encuentran a usted. O simplemente pueden aparecer sugerencias. Este rincón tremendamente encantador de Internet está impulsado por conjuntos de datos y modelos cada vez más masivos.

NVIDIA Merlin es el combustible para cohetes de los recomendadores. Al impulsar la capacitación y la inferencia, permite que las empresas de todo tipo aprovechen mejor los datos para crear recomendadores acelerados por las GPU de NVIDIA.

Hay más en juego que nunca para los negocios en línea. Se esperaba que las ventas en línea en 2021 alcanzaran casi $5 billones en todo el mundo, según eMarketer, casi un 17 por ciento más que el año anterior.

En algunos de los sitios en línea más grandes del mundo, incluso un aumento del 1 por ciento en la precisión de la relevancia de las recomendaciones puede generar miles de millones más en ventas.

La inversión en sistemas de recomendación se ha convertido en una de las mayores ventajas competitivas de los gigantes de Internet en la actualidad.

Se espera que el mercado de recomendadores alcance los 15.130 millones de dólares para 2026, frente a los 2.120 millones de dólares de 2020, según Mordor Intelligence. El segmento más grande y de más rápido crecimiento del mercado de motores de recomendación se encuentra en la región de Asia Pacífico, según la firma de investigación.

Pero un desafío de la industria es que la relevancia mejorada requiere más datos y procesamiento. Estos datos consisten en billones de interacciones entre usuarios y productos (clics, vistas) en miles de millones de productos y perfiles de consumidores.

Los datos de esta escala pueden tardar días en entrenar modelos. Sin embargo, cuanto más rápido pueda desarrollar nuevos modelos basados ​​en más datos, mayor será su relevancia.

La colección de modelos, métodos y bibliotecas de Merlin incluye herramientas para construir sistemas basados ​​en deep learning capaces de manejar terabytes de datos que pueden proporcionar mejores predicciones y aumentar los clics.

SNAP utiliza Merlin y GPU para la Ventaja en Inferencia

Se espera que la publicidad digital en EE. UU. alcance los 191.100 millones de dólares en 2021, un 25,5 % más que el año anterior, según eMarketer.

Snap, empresa matriz de la aplicación de redes sociales Snapchat, tiene su sede en Santa Mónica, California, y cuenta con más de 300 millones de usuarios activos diarios. Crea ingresos publicitarios a partir de su servicio de mensajería de fotos y videos sociales.

“Seguiremos enfocándonos en brindar resultados sólidos para nuestros socios publicitarios e innovar para expandir las capacidades de nuestra plataforma y servir mejor a nuestra comunidad”, dijo el CEO de Snap, Evan Spiegel, en su declaración de ganancias del tercer trimestre.

El obstáculo técnico para Snap es que busca continuar desarrollando los modelos de clasificación de mayor costo de su carga de trabajo y expandirse a modelos más complejos mientras reduce los costos.

La empresa usó GPU NVIDIA y Merlin para impulsar sus capacidades de clasificación de contenido.

“Snap usó las GPU de NVIDIA y el software Merlin para mejorar la eficiencia de los costos de inferencia de machine learning en un 50% y reducir la latencia de servicio en 2 veces, lo que proporciona el margen de cómputo para experimentar e implementar modelos de clasificación de contenido y anuncios más pesados ​​y precisos”, dijo Nima Khajehnouri, vicepresidente de ingeniería en Snap.

Tencent Impulsa la Capacitación de Modelos con HugeCTR de Merlin

El gigante del entretenimiento Tencent, que opera el enormemente popular servicio de mensajería WeChat y la plataforma de pagos WeChat Pay, es la empresa más grande de China por capitalización de mercado.

Sus ingenieros necesitan iterar rápidamente en los modelos para su sistema de recomendación de publicidad, lo que exige cada vez más su rendimiento de capacitación.

“La publicidad es un negocio relativamente importante dentro de Tencent y el sistema de recomendación se utiliza para aumentar los ingresos publicitarios generales”, dijo Xiangting Kong, ingeniero experto de Tencent.

El problema es que la precisión de la recomendación publicitaria solo puede mejorarse entrenando más datos de muestra, incluidas más características de muestra, pero esto conduce a tiempos de entrenamiento más prolongados que afectan la frecuencia de actualización del modelo.

“HugeCTR, como framework de entrenamiento de recomendaciones, está integrado en el sistema de entrenamiento de recomendaciones publicitarias para hacer que la frecuencia de actualización del entrenamiento de modelos sea más rápida y se puedan entrenar más muestras para mejorar los efectos en línea”, dijo.

Una vez que se mejora el rendimiento del modelo de entrenamiento, se pueden entrenar más datos para mejorar la precisión del modelo, lo que aumenta los ingresos por publicidad, agregó.

Meituan Reduce Costos con las GPU NVIDIA A100

El negocio de Meituan se encuentra en una concurrida intersección de alimentos, entretenimiento y servicios a pedido, entre sus 200 categorías de servicios. El gigante chino de Internet tiene más de 667 millones de usuarios activos y 8,3 millones de comerciantes activos.

Jun Huang, experto técnico sénior de Meituan, dijo que si su equipo puede mejorar mucho el rendimiento, por lo general prefiere entrenar más muestras y modelos más complejos.

El problema para Meituan fue que a medida que sus modelos se volvían más y más complejos, se hizo difícil optimizar profundamente el framework de capacitación, dijo Huang.

“Estamos trabajando para integrar NVIDIA HugeCTR en nuestro sistema de capacitación basado en GPU A100. El costo también se reduce considerablemente. Este es un resultado de optimización preliminar, y todavía hay mucho espacio para optimizar en el futuro”, dijo.

Meituan informó recientemente que su número promedio de transacciones por usuario aumentó a 32,8 durante los últimos 12 meses del segundo trimestre de 2021, en comparación con 25,7 durante los últimos 12 meses del segundo trimestre de 2020.

Obtén más información sobre NVIDIA Merlin. Obtén más información sobre NVIDIA Triton.