NVIDIA presentó DRIVE Alpamayo-R1 (AR1), un modelo de inteligencia artificial que marca un antes y un después en la investigación sobre vehículos autónomos. Se trata del primer modelo VLA (visión-lenguaje-acción) de razonamiento abierto del mundo creado específicamente para estudiar y mejorar la conducción autónoma. Su gran aporte es integrar el razonamiento paso a paso —conocido como chain-of-thought— directamente en la planificación de rutas, una función clave para alcanzar niveles de autonomía más avanzados.
A diferencia de generaciones anteriores de modelos, que solían fallar en situaciones ambiguas, AR1 está diseñado para manejar escenarios reales mucho más complejos: Intersecciones llenas de peatones, un carril que se cierra de manera imprevista o un auto estacionado en doble fila son situaciones que requieren algo más que sensores, necesitan razonamiento, algo similar al “sentido común” que aplicaría un conductor humano.
AR1 afronta estas situaciones desglosando el escenario en pequeños pasos y evaluando todas las trayectorias posibles. Luego, utiliza la información del entorno para decidir la mejor opción. Por ejemplo, si un vehículo autónomo circula por una zona con muchos peatones junto a un carril para bicicleta, AR1 puede analizar su recorrido, explicar por qué tomó determinadas decisiones y usar ese razonamiento para ajustar su trayectoria futura, ya sea desviándose ligeramente o reduciendo la velocidad.

Una de las claves del proyecto es que AR1 es un modelo abierto, construido sobre la base de NVIDIA Cosmos Reason, permitiendo a investigadores adaptarlo a distintos experimentos y pruebas no comerciales. Además, el modelo mejora especialmente después del entrenamiento adicional con aprendizaje por refuerzo, técnica que ha demostrado potenciar de forma notable sus capacidades de razonamiento.
NVIDIA pondrá AR1 a disposición del público en GitHub y Hugging Face, junto con parte de los datos utilizados para entrenarlo, disponibles en NVIDIA Physical AI Open Datasets. Además, la compañía lanzó AlpaSim, un framework de código abierto diseñado para evaluar el desempeño del modelo en diferentes escenarios.
Con AR1, NVIDIA abre una nueva frontera en el desarrollo de vehículos autónomos, ofreciendo a la comunidad científica una herramienta potente para investigar cómo lograr autos que realmente comprendan su entorno y tomen decisiones más seguras y humanas.