Apprendimento di Rappresentazioni Ibride per la Manipolazione Robotica
Un nuovo framework di pre-addestramento per la manipolazione robotica apprende punti latenti strutturali ibridi inserendo un autoencoder variazionale latente punto-punto nello spazio latente di un autoencoder di nuvole di punti. Questo approccio regolarizza congiuntamente le caratteristiche e le coordinate punto-punto verso un prior gaussiano, producendo un latente compatto che cattura tendenze strutturali grossolane senza geometria precisa. Il metodo combina l'espressività dei campi neurali impliciti con indizi geometrici espliciti, affrontando i limiti delle rappresentazioni sia completamente implicite che completamente esplicite nel pre-addestramento 3D. Il framework mira a migliorare le rappresentazioni visive per la percezione incarnata e i compiti di manipolazione.
Fatti principali
- Il framework apprende punti latenti strutturali ibridi.
- Inserisce un VAE latente punto-punto nello spazio latente di un autoencoder di nuvole di punti.
- Le caratteristiche e le coordinate punto-punto sono regolarizzate verso un prior gaussiano.
- Il latente risultante cattura tendenze strutturali grossolane e informazioni approssimative sulla forma.
- Non codifica la geometria precisa.
- Il metodo affronta i limiti delle rappresentazioni completamente implicite e completamente esplicite.
- È progettato per la percezione incarnata e compiti di manipolazione.
- L'articolo è disponibile su arXiv con ID 2605.21258.
Entità
—