RoboWM-Bench Introduce una Valutazione Incorporata per i Modelli Video del Mondo nella Robotica

ai-technology · 2026-04-22

RoboWM-Bench è un benchmark innovativo progettato per affrontare le carenze nella valutazione dei modelli video del mondo per la manipolazione robotica. Sebbene i recenti sviluppi consentano previsioni future realistiche, l'accuratezza visiva non garantisce la fattibilità fisica, poiché le azioni derivate dai video generati spesso violano le leggi fisiche. Gli attuali benchmark tendono a concentrarsi sulla percezione e mancano di un approccio sistematico per valutare compiti azionabili. Al contrario, RoboWM-Bench enfatizza una valutazione incentrata sulla manipolazione, trasformando i comportamenti sia dai video umani che robotici in sequenze di azioni incorporate che vengono verificate attraverso l'esecuzione robotica effettiva. Coprendo vari scenari di manipolazione, questo benchmark collega la qualità della previsione visiva con l'implementabilità fisica. Questa ricerca è dettagliata nella preprint arXiv 2604.19092v1, affrontando la domanda di sistemi affidabili di apprendimento robotico che utilizzano modelli di previsione video.

Fatti principali

RoboWM-Bench valuta i modelli video del mondo per la manipolazione robotica
Il realismo visivo nei video generati non garantisce la plausibilità fisica
I comportamenti dai video generati spesso violano la dinamica quando eseguiti
Gli attuali benchmark rimangono orientati alla percezione senza valutazione sistematica dell'esecuzione
Il benchmark converte i comportamenti generati in sequenze di azioni incorporate
La convalida avviene attraverso l'esecuzione robotica effettiva
Affronta il divario tra previsione visiva e eseguibilità fisica
Il lavoro appare nella preprint arXiv 2604.19092v1

RoboWM-Bench Introduce una Valutazione Incorporata per i Modelli Video del Mondo nella Robotica

Fatti principali

Entità

Istituzioni

Fonti