Fallimento Multimodale nel Behavioral Cloning con Action-Chunking
Un recente studio pubblicato su arXiv (2605.22493) esamina le carenze del behavioral cloning quando una singola osservazione può portare a molteplici azioni appropriate, concentrandosi sulle strategie di action-chunking. Le politiche a variabili latenti incontrano problemi con la regolarizzazione posteriore-priori: una regolarizzazione eccessiva elimina dati cruciali condizionati dall'azione necessari per la differenziazione delle modalità, mentre una regolarizzazione insufficiente porta a campionamenti inaffidabili se il priore non copre aree latenti significative. Inoltre, le politiche generative nello spazio delle azioni sono limitate dalla morbidezza del trasporto dalla base all'azione; una mappatura con una costante di Lipschitz bassa fatica ad assegnare alta probabilità a modalità distinte, richiedendo transizioni brusche nello spazio di base o connessioni fuori supporto nello spazio delle azioni. Esperimenti condotti con dati sintetici evidenziano queste modalità di fallimento.
Fatti principali
- L'articolo arXiv 2605.22493 studia il fallimento multimodale nel behavioral cloning con action-chunking
- Il behavioral cloning diventa difficile quando la stessa osservazione ammette più azioni valide
- Politiche a variabili latenti: la regolarizzazione posteriore-priori influisce sulla distinzione delle modalità e sull'affidabilità del campionamento
- Politiche generative nello spazio delle azioni: la multimodalità è vincolata dalla costante di Lipschitz del trasporto dalla base all'azione
- Coprire molte modalità richiede transizioni brusche nello spazio di base o regioni ponte fuori supporto
- Gli esperimenti sono stati condotti su dati sintetici
Entità
Istituzioni
- arXiv