Con la promesa de ayudar a procesar imágenes de manera más rápida y eficiente a gran escala, NVIDIA presentó el martes CV-CUDA, una biblioteca de código abierto para construir pipelines de procesamiento de imágenes y visión artificial aceleradas de extremo a extremo.
La mayor parte del tráfico de Internet es video. Cada vez más, este video se complementará con efectos especiales de IA y gráficos por computadora.
Para agregar a esta complejidad, los servicios de intercambio de videos y redes sociales de rápido crecimiento están experimentando costos crecientes de computación en el cloud y cuellos de botella en sus pipelines de procesamiento de imágenes basadas en IA y visión por computadora.
CV-CUDA acelera los efectos especiales de IA, como volver a iluminar, reposar, desenfocar fondos y superresolución.
Las GPU de NVIDIA ya aceleran la parte de inferencia de los pipelines de visión por computadora de IA. Pero el preprocesamiento y el posprocesamiento con herramientas tradicionales de visión por computadora consumen tiempo y potencia de computación.
CV-CUDA brinda a los desarrolladores más de 50 algoritmos de visión por computadora de alto rendimiento, un framework de desarrollo que facilita la implementación de kernels personalizados e interfaces de copia cero para eliminar los cuellos de botella en el pipeline de IA.
El resultado es un mayor rendimiento y menores costos de computación en el cloud. CV-CUDA puede procesar 10 veces más flujos en una sola GPU.
Todo esto ayuda a los desarrolladores a moverse mucho más rápido cuando abordan la creación de contenido de video, mundos 3D, sistemas de recomendación basados en imágenes, reconocimiento de imágenes y videoconferencias.
Las plataformas de creación de contenido de video deben procesar, mejorar y moderar millones de transmisiones de video diariamente y garantizar que los usuarios móviles tengan la mejor experiencia al ejecutar sus aplicaciones en cualquier teléfono.
- Para aquellos que crean mundos 3D o aplicaciones de metaverso, CV-CUDA permite tareas como estructura a partir del movimiento, formas basadas en estéreo y flujo óptico para ayudar a construir o ampliar mundos 3D y sus componentes.
- En la comprensión y el reconocimiento de imágenes, CV-CUDA puede acelerar significativamente los pipelines de reconocimiento que se ejecutan a hiperescala, lo que permite a los usuarios móviles disfrutar de aplicaciones de reconocimiento de imágenes sofisticadas y receptivas.
- Y en videoconferencia, CV-CUDA puede admitir funciones sofisticadas basadas en realidad aumentada. Estas características podrían involucrar procesos complejos de IA que requieren numerosos pasos de procesamiento previo y posterior.
- CV-CUDA acelera los pipelines de procesamiento previo y posterior a través de kernels CUDA optimizados a mano y se integra de forma nativa en C/C++, Python y frameworks comunes de Deep learning, como PyTorch.
CV-CUDA será una de las tecnologías centrales que pueden acelerar los flujos de trabajo de IA en NVIDIA Omniverse, una plataforma de colaboración y simulación de mundo virtual para flujos de trabajo 3D.
Los desarrolladores pueden obtener acceso anticipado al código en diciembre de 2022, con una versión beta para marzo de 2023.
Para obtener más información, visite nuestra página de interés de acceso anticipado en developer.nvidia.com/cv-cuda-early-access.