CorridorVLA: Ancoraggi spaziali sparsi migliorano la generazione di azioni robotiche

ai-technology · 2026-04-25

I ricercatori propongono CorridorVLA, un metodo per modelli Visione-Linguaggio-Azione (VLA) che utilizza ancoraggi spaziali sparsi per imporre regioni di tolleranza esplicite durante la generazione di azioni. Questi ancoraggi definiscono un corridoio che guida una testa di azione basata su flow-matching, correggendo le traiettorie che escono dal corridoio pur consentendo piccole deviazioni. Sul benchmark LIBERO-Plus, CorridorVLA migliora i tassi di successo del 3,4%–12,4% rispetto ai baselines, con la variante GR00T-Corr che raggiunge un tasso di successo dell'83,21%. L'approccio affronta la sfida di iniettare una guida spaziale in modo esplicito anziché implicito attraverso caratteristiche latenti.

Fatti principali

CorridorVLA predice ancoraggi spaziali sparsi come cambiamenti fisici incrementali (posizioni Δ).
Gli ancoraggi definiscono una regione di tolleranza nell'obiettivo di addestramento per la generazione di azioni.
Le traiettorie al di fuori del corridoio ricevono gradienti correttivi.
Sono consentite piccole deviazioni dovute a contatti e rumore di esecuzione.
Testato sul benchmark LIBERO-Plus.
Miglioramenti costanti nei modelli SmolVLA e GR00T.
Miglioramento del tasso di successo del 3,4%–12,4% rispetto ai baselines.
La variante GR00T-Corr raggiunge un tasso di successo dell'83,21%.

Entità

—

Fonti

arXiv cs.AI — 2026-04-25