Studio rivela fragilità del ragionamento nei VLA per guida autonoma sotto perturbazioni dei sensori
Uno studio recente pubblicato su arXiv (2605.21446) esamina la resilienza dei modelli Vision-Language-Action (VLA) nel contesto della guida autonoma quando si trovano ad affrontare deterioramenti reali dei sensori. I ricercatori hanno condotto un'analisi sistematica delle perturbazioni su Alpamayo R1, che ha 10 miliardi di parametri, in 1.996 scenari diversi. Hanno introdotto otto tipi di disturbi ai sensori, tra cui rumore gaussiano a quattro livelli, due condizioni estreme di illuminazione e due condizioni di nebbia, ottenendo quasi 18.000 test di inferenza. Risultati notevoli indicano che la coerenza del ragionamento funge da predittore affidabile dell'accuratezza della traiettoria: quando le spiegazioni Chain-of-Causation (CoC) vengono alterate a causa delle perturbazioni, la deviazione della traiettoria aumenta di 5,3 volte (21,8 m rispetto a 4,1 m), con un coefficiente di correlazione di r=0,99 tra vari tipi di attacco e una correlazione punto-biseriale di r_pb=0,53 per campione (d di Cohen=1,12). Inoltre, uno studio di ablazione controllato suggerisce che l'attivazione della generazione CoC migliora la precisione della traiettoria dell'11,8%.
Fatti principali
- Lo studio valuta il modello VLA Alpamayo R1 (10 miliardi di parametri) per la guida autonoma
- 1.996 scenari testati sotto 8 perturbazioni dei sensori
- Circa 18.000 prove di inferenza condotte
- La coerenza del ragionamento è un indicatore ad alta fedeltà dell'affidabilità della traiettoria
- La deviazione della traiettoria aumenta di 5,3x quando le spiegazioni CoC cambiano
- Coefficiente di correlazione r=0,99 tra i tipi di attacco
- d di Cohen=1,12 per la dimensione dell'effetto per campione
- Abilitare la generazione CoC migliora l'accuratezza della traiettoria dell'11,8%
Entità
Istituzioni
- arXiv