Cómo la IA Está Desbloqueando la Conducción Autónoma de Nivel 4

por Marco Pavone

Cuando la Society of Automotive Engineers estableció su framework para la autonomía del vehículo en 2014, creó la hoja de ruta estándar del sector para la tecnología de conducción autónoma.

Los niveles de automatización progresan desde nivel 1 (asistencia al conductor) hasta nivel 2 (automatización parcial), nivel 3 (automatización condicional), nivel 4 (alta automatización) y nivel 5 (automatización completa).

Predecir cuándo llegaría cada nivel resultó más complicado que definirlos. Esta incertidumbre generó expectación en toda la industria, ya que los avances parecían estar siempre a la vuelta de la esquina.

Esa dinámica ha cambiado significativamente en los últimos años, con más avances en la conducción autónoma en los últimos tres o cuatro años que en la década anterior combinada. A continuación, conoce los avances recientes que han hecho posible un progreso tan rápido.

¿Qué Es la Conducción Autónoma de Nivel 4?

La conducción autónoma de Nivel 4 permite a los vehículos realizar todas las tareas de conducción dentro de zonas de operación específicas, como ciertas ciudades o rutas, sin necesidad de intervención humana. Este alto nivel de automatización utiliza avances en IA, incluyendo modelos base, arquitecturas de extremo a extremo y modelos de razonamiento, para navegar escenarios complejos.

Hoy en día, el nivel 4 de «alta automatización» está acercando la visión de la conducción autónoma a una realidad escalable y comercialmente viable.

Seis Avances en IA Que Avanzan en Vehículos Autónomos

Seis grandes avances en IA están convergiendo para acelerar la autonomía de nivel 4:

1. Modelos Base

Los modelos base pueden aprovechar conocimientos a escala de internet, no solo datos propietarios de flotas de conducción.

Cuando los humanos aprenden a conducir, por ejemplo, a los 18 años, aportan 18 años de experiencia mundial a la empresa. De manera similar, los modelos base aportan una amplia variedad de conocimientos: comprender escenarios inusuales y predicer resultados basándose en el conocimiento general del mundo.

Con los modelos base, un vehículo que se encuentra con un colchón en la carretera o con una pelota rodando hacia la calle puede ahora razonar a través de escenarios que nunca antes había visto, basándose en la información adquirida de vastos conjuntos de datos de entrenamiento.

2. Arquitecturas de Extremo a Extremo

Los sistemas de conducción autónoma tradicionales utilizaban módulos separados para la percepción, planificación y control, perdiendo información en cada entrega.

Las arquitecturas de autonomía de extremo a extremo tienen el potencial de cambiar eso. Con las arquitecturas de extremo a extremo, una sola red procesa las entradas de los sensores directamente en las decisiones que impulsan, manteniendo el contexto durante todo el proceso. Aunque el concepto de arquitecturas de extremo a extremo no es nuevo, los avances arquitectónicos y las metodologías de formación mejoradas están haciendo finalmente viable este paradigma, lo que resulta en una mejor toma de decisiones autónoma con menos complejidad de ingeniería.

3. Modelos de Razonamiento

Los modelos de razonamiento, visión y acción del lenguaje (VLA) integran diversas entradas perceptivas, comprensión del lenguaje y generación de acciones con razonamiento paso a paso. Esto les permite desglosar situaciones complejas, evaluar múltiples posibles resultados y decidir el mejor curso de acción, al igual que hacen los humanos.

Los sistemas impulsados por modelos de razonamiento ofrecen una fiabilidad y rendimiento mucho mayores, con una toma de decisiones explicable paso a paso. Para los vehículos autónomos, esto significa la capacidad de marcar patrones de decisión inusuales para monitorización de seguridad en tiempo real, así como para depuración posterior a incidentes que revelen por qué un vehículo tomó una determinada acción. Esto mejora el rendimiento de los vehículos autónomos y genera confianza en los usuarios.

4. Simulación

Solo con pruebas físicas, llevaría décadas probar una póliza de conducción en todos los escenarios posibles, si es que alguna vez es posible. Entra la simulación.

Tecnologías como la reconstrucción neuronal pueden utilizarse para crear simulaciones interactivas a partir de datos reales de sensores, mientras que modelos mundiales como NVIDIA Cosmos Predict and Transfer generan situaciones novedosas ilimitadas para entrenar y probar vehículos autónomos.

Con estas tecnologías, los desarrolladores pueden utilizar prompts de texto para generar nuevas condiciones meteorológicas y de carretera, o cambiar la iluminación e introducir obstáculos para simular nuevos escenarios y políticas de prueba de conducción en condiciones novedosas.

5. Potencia de Cálculo

Ninguno de estos avances sería posible sin suficiente capacidad computacional. Las plataformas NVIDIA DRIVE AGX y NVIDIA DGX han evolucionado a lo largo de varias generaciones, cada una diseñada tanto para las cargas de trabajo actuales de IA como para las esperadas años después.

La co-optimización importa. La tecnología debe diseñarse anticipando las demandas computacionales de los sistemas de IA de próxima generación.

6. Seguridad en IA

La seguridad es fundamental para la autonomía de nivel 4, donde la fiabilidad es la característica definitoria que la distingue de los niveles de autonomía inferiores. Los avances recientes en la seguridad física de la IA permiten el despliegue fiable de pilas de autonomía basadas en IA al introducir barreras de seguridad en las etapas de diseño, despliegue y validación.

Por ejemplo, la arquitectura de seguridad de NVIDIA protege el modelo de conducción de extremo a extremo con comprobaciones apoyadas por una pila modular diversa, y la validación se acelera considerablemente gracias a los últimos avances en reconstrucción neuronal.

Estas y otras barreras forman parte de NVIDIA Halos, un sistema de seguridad integral que unifica la arquitectura NVIDIA DRIVE, el  sistema operativo NVIDIA DriveOS certificado en seguridad, y modelos, hardware, software, herramientas y servicios de IA para ayudar a garantizar el desarrollo y despliegue seguro de vehículos autónomos desde la nube hasta el coche. Los socios NVIDIA pueden adoptar componentes individuales o la pila completa, según sus necesidades.

Por Qué Importa: Salvar Vidas y Recursos

Las apuestas van mucho más allá del logro tecnológico. Mejorar la seguridad vehicular puede ayudar a salvar vidas y ahorrar cantidades significativas de dinero y recursos. La autonomía de nivel 4 elimina sistemáticamente el error humano, la causa de la gran mayoría de los accidentes.

NVIDIA, como empresa de vehículos autónomos full-stack, desde la nube hasta el coche, está permitiendo que el ecosistema automovilístico más amplio alcance la autonomía de nivel 4, construyendo sobre la base de su pila de nivel 2+ ya en producción. En particular, NVIDIA es la única empresa que ofrece una pila de computación de extremo a extremo para la conducción autónoma.

Sus tres plataformas de computación de IA críticas para la autonomía son:

Juntas, estas plataformas forman un bucle de retroalimentación para el aprendizaje, las pruebas y el despliegue que aprieta el ciclo de innovación manteniendo la seguridad en primer plano.