La ciudad de Liverpool, Australia, a 27 kilómetros al suroeste de Sídney, está creciendo rápidamente, ya que cuenta un nuevo campus universitario cerca y un aeropuerto en construcción.
Se espera que más de 30 000 personas viajen diariamente a su distrito central de negocios. Liverpool necesitaba conocer el posible impacto en el flujo de tráfico y el movimiento de peatones, ciclistas y vehículos.
La ciudad ya cuenta cámaras de circuito cerrado para monitorear la seguridad. Cada circuito cerrado de televisión captura una gran cantidad de videos y datos que, debido a las estrictas regulaciones de privacidad, se revisan principalmente después de que se ha informado un incidente.
El desafío de la ciudad era convertir este enorme conjunto de datos en información que pudiera ayudarla a funcionar de manera más eficiente, manejar la afluencia de viajeros y mantener el lugar habitable para los residentes, sin comprometer la privacidad de nadie.
Para lograr este objetivo, la ciudad se ha asociado con el Laboratorio de Viviendas Digitales de la Universidad de Wollongong. DLL es parte de parte de la Instalación de Infraestructura SMART de Wollongong y ha desarrollado la plataforma Versátil de Análisis Inteligente de Videos. VIVA, para abreviar, desbloquea datos para que los propietarios de redes de CCTV puedan acceder a ellos en tiempo real y sin infringir la privacidad para tomar decisiones mejor informadas.
VIVA se diseñó para convertir la infraestructura existente en dispositivos de procesamiento en el edge integrados con la última IA. Los algoritmos de deep learning de última generación de la plataforma se desarrollan en DLL mediante la plataforma NVIDIA Metropolis. Sus modelos de deep learning para el análisis de video están entrenados usando el aprendizaje por transferencia para adaptarse a casos de uso, optimizados a través del software NVIDIA TensorRT e implementados en computadoras de IA en el edge NVIDIA Jetson.
“Diseñamos VIVA para procesar las transmisiones de video lo más cerca posible de la fuente, que es la cámara”, dijo Johan Barthelemy, profesor de la Instalación de Infraestructura SMART de la Universidad de Wollongong. «Una vez que un cuadro ha sido analizado utilizando una red neuronal profunda, el resultado se transmite y el cuadro actual se descarta.”
La eliminación de marcos mantiene la privacidad ya que no se transmiten imágenes. También reduce el ancho de banda necesario.
Más allá de las calles de la ciudad, como en Liverpool, VIVA se ha adaptado para una amplia variedad de aplicaciones, como la identificación y el seguimiento de la vida silvestre; detectar el bloqueo de alcantarillas para el manejo de aguas pluviales y alertas tempranas de inundaciones repentinas; y el seguimiento de personas que utilizan cámaras térmicas para comprender el comportamiento de movilidad de las personas durante las olas de calor. También puede distinguir entre los bomberos que buscan un edificio y otros ocupantes del edificio, lo que ayuda a identificar a aquellos que pueden necesitar ayuda durante una evacuación.
Darles Sentido a los Patrones de Tráfico
La colaboración de investigación entre SMART, el ayuntamiento de Liverpool y sus socios de la industria está destinada a mejorar la eficiencia, la eficacia y la accesibilidad de una gama de servicios e instalaciones gubernamentales.
Para los peatones, el objetivo del proyecto es comprender hacia dónde se dirigen, sus rutas preferidas y qué áreas están congestionadas. Para los ciclistas, se trata de las rutas que utilizan y las formas de mejorar el uso de la bicicleta. Para los vehículos, es clave comprender los patrones de movimiento y tráfico, dónde se detienen y dónde se estacionan.
Según Barthelemy, comprender la movilidad dentro de una ciudad anteriormente requería una flota de sensores costosos y fijos. Se necesitaban diferentes modelos para contar tipos específicos de tráfico, y se utilizaron procesos manuales para comprender cómo interactuaban entre sí los diferentes tipos de tráfico.
Mediante la visión artificial en el NVIDIA Jetson TX2 en el edge, la plataforma VIVA puede contar los diferentes tipos de tráfico y capturar su trayectoria y velocidad. Los datos se recopilan utilizando la red de CCTV existente de la ciudad, lo que elimina la necesidad de invertir en sensores adicionales.
Los patrones de movimiento y los puntos de congestión se identifican y predicen para ayudar a mejorar el diseño y la conectividad de las calles y los senderos, la gestión del tráfico y las rutas guiadas. Los datos han sido invaluables para ayudar a Liverpool a planificar el diseño urbano y la gestión del tráfico de su distrito central de negocios.
Aplicación de Machine Learning Creada con las Tecnologías de NVIDIA
SMART entrenó las aplicaciones de machine learning en su plataforma VIVA para Liverpool en cuatro workstations potenciadas por una variedad de GPU NVIDIA TITAN, así como en seis workstations equipadas con GPU NVIDIA RTX para generar datos sintéticos y realizar experimentos.
Además de utilizar bases de datos abiertas como OpenImage, COCO y Pascal VOC para la capacitación, DLL creó datos sintéticos a través de una aplicación interna basada en Unity Engine. Los datos sintéticos permiten que el proyecto aprenda de numerosos escenarios que, de otro modo, no estarían presentes en un momento dado, como tormentas de lluvia o masas de ciclistas.
“Esta generación de datos sintéticos nos permitió generar más de 35 000 imágenes por escenario de interés bajo diferentes condiciones climáticas, hora del día y condiciones de iluminación”, dijo Barthelemy. “La generación de datos sintéticos utiliza el ray tracing para mejorar el realismo de las imágenes generadas.”
La referencia se realiza con NVIDIA Jetson Nano, NVIDIA Jetson TX2 y NVIDIA Jetson Xavier NX, según el caso de uso y el procesamiento requerido.