RoboWM-Bench Introduce una Valutazione Incorporata per i Modelli Video del Mondo nella Robotica
RoboWM-Bench è un benchmark innovativo progettato per affrontare le carenze nella valutazione dei modelli video del mondo per la manipolazione robotica. Sebbene i recenti sviluppi consentano previsioni future realistiche, l'accuratezza visiva non garantisce la fattibilità fisica, poiché le azioni derivate dai video generati spesso violano le leggi fisiche. Gli attuali benchmark tendono a concentrarsi sulla percezione e mancano di un approccio sistematico per valutare compiti azionabili. Al contrario, RoboWM-Bench enfatizza una valutazione incentrata sulla manipolazione, trasformando i comportamenti sia dai video umani che robotici in sequenze di azioni incorporate che vengono verificate attraverso l'esecuzione robotica effettiva. Coprendo vari scenari di manipolazione, questo benchmark collega la qualità della previsione visiva con l'implementabilità fisica. Questa ricerca è dettagliata nella preprint arXiv 2604.19092v1, affrontando la domanda di sistemi affidabili di apprendimento robotico che utilizzano modelli di previsione video.
Fatti principali
- RoboWM-Bench valuta i modelli video del mondo per la manipolazione robotica
- Il realismo visivo nei video generati non garantisce la plausibilità fisica
- I comportamenti dai video generati spesso violano la dinamica quando eseguiti
- Gli attuali benchmark rimangono orientati alla percezione senza valutazione sistematica dell'esecuzione
- Il benchmark converte i comportamenti generati in sequenze di azioni incorporate
- La convalida avviene attraverso l'esecuzione robotica effettiva
- Affronta il divario tra previsione visiva e eseguibilità fisica
- Il lavoro appare nella preprint arXiv 2604.19092v1
Entità
Istituzioni
- arXiv