GAP: Il Pre-addestramento Geometrico con Ancore Potenzia l'Apprendimento Robotico da Poche Dimostrazioni
Un nuovo approccio chiamato Geometric Anchor Pre-training (GAP) è stato introdotto dai ricercatori per migliorare l'efficienza dei dati nella manipolazione robotica attraverso l'apprendimento di politiche visuomotorie. GAP affronta il problema della scarsità di dimostrazioni esperte regolarizzando un modulo di pooling spaziale che adatta i modelli di visione pre-addestrati (VFMs) per compiti di controllo. In assenza di GAP, questo adattatore rischia di sovradattarsi a scorciatoie irrilevanti e può perdere la sua base geometrica quando viene affinato con campioni minimi. Prima dell'apprendimento per imitazione downstream, GAP pre-addestra il livello di pooling utilizzando un compito proxy simulato leggero, incorporando così bias induttivi orientati alla robustezza. Questo metodo semplice e senza azione funge da fase preparatoria. La ricerca è disponibile su arXiv con ID 2605.15836.
Fatti principali
- GAP sta per Geometric Anchor Pre-training
- GAP è una fase di riscaldamento per l'apprendimento di politiche visuomotorie
- Regolarizza l'adattatore spaziale prima dell'apprendimento per imitazione
- GAP si pre-addestra su un compito proxy simulato leggero
- Affronta il sovradattamento dovuto alla scarsità di dimostrazioni esperte
- I VFMs pre-addestrati migliorano l'efficienza dei dati ma spostano l'adattamento a un piccolo modulo di pooling
- Il modulo di pooling può agganciarsi a scorciatoie irrilevanti per il compito
- L'articolo è disponibile su arXiv con ID 2605.15836
Entità
Istituzioni
- arXiv