NVIDIA presenta en NeurIPS nuevos modelos y herramientas de IA abierta para la conducción autónoma y el procesamiento del habla, destacando su compromiso con la transparencia y la innovación en la investigación.
NVIDIA ha dado un paso significativo en el desarrollo de modelos de inteligencia artificial (IA) abiertos durante la conferencia NeurIPS, uno de los encuentros más destacados en el ámbito de la IA. La compañía ha presentado nuevas herramientas y modelos que abarcan desde la conducción autónoma hasta la seguridad en la IA, destacando el lanzamiento del NVIDIA DRIVE Alpamayo-R1, el primer modelo de acción de visión y lenguaje a escala industrial para movilidad.
Con esta expansión, NVIDIA busca equipar a la comunidad investigadora con las últimas innovaciones en IA digital y física, lo que podría tener aplicaciones en casi todos los campos de investigación. En total, se están presentando más de 70 trabajos, charlas y talleres que abarcan temas como el razonamiento en IA, investigación médica y desarrollo de vehículos autónomos.
El compromiso de NVIDIA con el código abierto ha sido reconocido por un nuevo índice de apertura creado por Artificial Analysis, una organización independiente que evalúa la transparencia y apertura en el desarrollo de tecnologías de IA. Este índice clasifica a la familia NVIDIA Nemotron entre las más abiertas del ecosistema de IA, evaluando factores como la permisibilidad de las licencias del modelo y la disponibilidad de detalles técnicos.
El modelo NVIDIA DRIVE Alpamayo-R1 (AR1) es pionero en su categoría, integrando razonamiento AI con planificación de trayectorias, lo cual es crucial para mejorar la seguridad en situaciones complejas al volante. Este avance permite a los vehículos autónomos tomar decisiones más similares a las humanas, analizando cada escenario y considerando todas las trayectorias posibles antes de elegir el mejor camino.
La capacidad del AR1 para razonar sobre situaciones complejas marca un hito importante. Por ejemplo, al enfrentarse a una intersección concurrida por peatones o un carril cerrado temporalmente, este modelo puede evaluar datos contextuales y planificar su trayectoria futura para evitar peligros potenciales. Esta funcionalidad se traduce en una conducción más segura y eficiente.
El modelo se basa en NVIDIA Cosmos Reason, lo que permite a los investigadores personalizarlo para usos no comerciales, ya sea para pruebas o desarrollos experimentales. Además, se ha observado una mejora significativa en sus capacidades de razonamiento tras aplicar técnicas de aprendizaje por refuerzo durante su entrenamiento.
El AR1 estará disponible en plataformas como GitHub y Hugging Face, junto con un conjunto limitado de datos utilizados para su entrenamiento. NVIDIA también ha lanzado el marco open-source AlpaSim para evaluar este modelo innovador.
Los desarrolladores ahora pueden acceder al Cosmos Cookbook, una guía completa que detalla cómo utilizar y post-entrenar modelos basados en Cosmos. Esta herramienta cubre todos los aspectos del desarrollo en IA física, incluyendo curación de datos y generación sintética.
Las aplicaciones basadas en Cosmos son prácticamente ilimitadas. Algunos ejemplos recientes incluyen:
A medida que NVIDIA continúa expandiendo su ecosistema con estas innovaciones, queda claro que está estableciendo nuevos estándares tanto para el desarrollo abierto como para la aplicación práctica dentro del campo emergente de la inteligencia artificial.