Esecuzione Adattiva delle Azioni per Modelli di Azione nel Mondo
Un nuovo articolo su arXiv propone FFDC (Future Forward Dynamics Causal Attention), un verificatore leggero per i World Action Models (WAM) nella manipolazione robotica. I WAM prevedono congiuntamente osservazioni visive e azioni future, ma tipicamente eseguono un numero fisso di azioni dopo ogni inferenza, ignorando la coerenza con l'esecuzione reale. Gli autori formulano l'esecuzione adattiva come un problema di verifica futuro-realtà: i robot dovrebbero eseguire più a lungo quando le previsioni sono affidabili e riprogrammare prima quando si verificano deviazioni. FFDC ragiona su azioni previste, dinamiche visive, osservazioni reali e istruzioni linguistiche per stimare l'affidabilità delle azioni rimanenti, consentendo dimensioni adattive dei blocchi di azioni.
Fatti principali
- I World Action Models (WAM) prevedono congiuntamente osservazioni visive e azioni future.
- Gli attuali WAM eseguono un numero fisso di azioni dopo ogni inferenza.
- L'articolo propone l'esecuzione adattiva dei WAM come un problema di verifica futuro-realtà.
- FFDC (Future Forward Dynamics Causal Attention) è un verificatore leggero.
- FFDC ragiona su azioni previste, dinamiche visive, osservazioni reali e istruzioni linguistiche.
- FFDC consente dimensioni adattive dei blocchi di azioni.
- L'articolo è pubblicato su arXiv con ID 2605.06222.
- Il lavoro si concentra sulla manipolazione robotica.
Entità
Istituzioni
- arXiv