Apprendimento di Rappresentazioni Ibride per la Manipolazione Robotica

other · 2026-05-22

Un nuovo framework di pre-addestramento per la manipolazione robotica apprende punti latenti strutturali ibridi inserendo un autoencoder variazionale latente punto-punto nello spazio latente di un autoencoder di nuvole di punti. Questo approccio regolarizza congiuntamente le caratteristiche e le coordinate punto-punto verso un prior gaussiano, producendo un latente compatto che cattura tendenze strutturali grossolane senza geometria precisa. Il metodo combina l'espressività dei campi neurali impliciti con indizi geometrici espliciti, affrontando i limiti delle rappresentazioni sia completamente implicite che completamente esplicite nel pre-addestramento 3D. Il framework mira a migliorare le rappresentazioni visive per la percezione incarnata e i compiti di manipolazione.

Fatti principali

Il framework apprende punti latenti strutturali ibridi.
Inserisce un VAE latente punto-punto nello spazio latente di un autoencoder di nuvole di punti.
Le caratteristiche e le coordinate punto-punto sono regolarizzate verso un prior gaussiano.
Il latente risultante cattura tendenze strutturali grossolane e informazioni approssimative sulla forma.
Non codifica la geometria precisa.
Il metodo affronta i limiti delle rappresentazioni completamente implicite e completamente esplicite.
È progettato per la percezione incarnata e compiti di manipolazione.
L'articolo è disponibile su arXiv con ID 2605.21258.

Entità

—

Fonti

arXiv cs.AI — 2026-05-21