Fallimento Multimodale nel Behavioral Cloning con Action-Chunking

other · 2026-05-23

Un recente studio pubblicato su arXiv (2605.22493) esamina le carenze del behavioral cloning quando una singola osservazione può portare a molteplici azioni appropriate, concentrandosi sulle strategie di action-chunking. Le politiche a variabili latenti incontrano problemi con la regolarizzazione posteriore-priori: una regolarizzazione eccessiva elimina dati cruciali condizionati dall'azione necessari per la differenziazione delle modalità, mentre una regolarizzazione insufficiente porta a campionamenti inaffidabili se il priore non copre aree latenti significative. Inoltre, le politiche generative nello spazio delle azioni sono limitate dalla morbidezza del trasporto dalla base all'azione; una mappatura con una costante di Lipschitz bassa fatica ad assegnare alta probabilità a modalità distinte, richiedendo transizioni brusche nello spazio di base o connessioni fuori supporto nello spazio delle azioni. Esperimenti condotti con dati sintetici evidenziano queste modalità di fallimento.

Fatti principali

L'articolo arXiv 2605.22493 studia il fallimento multimodale nel behavioral cloning con action-chunking
Il behavioral cloning diventa difficile quando la stessa osservazione ammette più azioni valide
Politiche a variabili latenti: la regolarizzazione posteriore-priori influisce sulla distinzione delle modalità e sull'affidabilità del campionamento
Politiche generative nello spazio delle azioni: la multimodalità è vincolata dalla costante di Lipschitz del trasporto dalla base all'azione
Coprire molte modalità richiede transizioni brusche nello spazio di base o regioni ponte fuori supporto
Gli esperimenti sono stati condotti su dati sintetici

Fallimento Multimodale nel Behavioral Cloning con Action-Chunking

Fatti principali

Entità

Istituzioni

Fonti