ChainFlow-VLA unifica pianificazione causale e globale per la guida autonoma
Il nuovo framework ChainFlow-VLA, descritto in arXiv:2605.23270, mira a fondere la generazione causale con il raffinamento globale per la pianificazione delle traiettorie nella guida autonoma. I sistemi end-to-end esistenti affrontano sfide a causa della disconnessione tra il ragionamento causale temporale, gestito da modelli autoregressivi, e la coerenza globale della traiettoria, migliorata da modelli di diffusione. Mentre i modelli autoregressivi catturano efficacemente le dipendenze basate sull'interazione, tendono ad accumulare errori attraverso la decodifica passo-passo. Al contrario, i modelli di diffusione ottimizzano globalmente ma mancano di vincoli causali specifici, rendendoli meno affidabili in situazioni critiche per la sicurezza. ChainFlow-VLA affronta questo problema trattando la pianificazione come una miscela di modalità autoregressive e impiega un Modello Visione-Linguaggio per unificare entrambi gli approcci in un unico quadro probabilistico. L'articolo è disponibile su arXiv con ID 2605.23270.
Fatti principali
- ChainFlow-VLA unifica generazione causale e raffinamento globale in un quadro probabilistico.
- I modelli autoregressivi catturano le dipendenze temporali ma soffrono di accumulo di errori.
- I modelli di diffusione ottimizzano la traiettoria globale ma mancano di vincoli causali.
- Il framework formula la pianificazione come una miscela di modalità indotte da AR.
- Utilizza un Modello Visione-Linguaggio per integrare entrambi i paradigmi.
- L'articolo è disponibile su arXiv con ID 2605.23270.
- L'approccio affronta scenari interattivi critici per la sicurezza.
- I metodi esistenti trattano la modellazione causale e l'ottimizzazione globale separatamente.
Entità
Istituzioni
- arXiv