ARTFEED — Contemporary Art Intelligence

Correzione di Ritmo e Percorso Senza Addestramento per Modelli VLA

ai-technology · 2026-05-13

Una tecnica innovativa nota come Correzione di Ritmo e Percorso (PPC) affronta il problema della cecità dinamica nei modelli Visione-Linguaggio-Azione (VLA). Tipicamente, i VLA vengono addestrati utilizzando dati a fotogramma singolo, il che limita la loro capacità di percepire le dinamiche temporali, portando a significativi cali di prestazioni in ambienti non stazionari. Le alternative attuali richiedono costosi riaddestramenti o soffrono di problemi di latenza e incoerenza temporale. PPC opera come uno strumento a inferenza senza addestramento e in forma chiusa, applicabile a qualsiasi VLA ad azione segmentata. Separa un costo quadratico in due componenti distinte: un canale di ritmo che semplifica l'esecuzione nella direzione prevista, e un canale di percorso che introduce una regolazione spaziale ortogonale. Questa minimizzazione combinata integra efficacemente le dinamiche percepite senza necessità di riaddestramento. La ricerca è disponibile su arXiv con ID 2605.11459.

Fatti principali

  • I modelli VLA sono ciechi alle dinamiche temporali a causa dell'addestramento su fotogramma singolo.
  • PPC è un operatore a inferenza senza addestramento e in forma chiusa.
  • PPC si scompone in canali di ritmo e percorso.
  • Il canale di ritmo comprime l'esecuzione lungo la direzione pianificata.
  • Il canale di percorso applica uno scostamento spaziale ortogonale.
  • PPC avvolge qualsiasi VLA ad azione segmentata.
  • Il metodo affronta scenari non stazionari.
  • Articolo disponibile su arXiv: 2605.11459.

Entità

Istituzioni

  • arXiv

Fonti