ARTFEED — Contemporary Art Intelligence

Apprendimento di Rappresentazioni Ibride per la Manipolazione Robotica

other · 2026-05-22

Un nuovo framework di pre-addestramento per la manipolazione robotica apprende punti latenti strutturali ibridi inserendo un autoencoder variazionale latente punto-punto nello spazio latente di un autoencoder di nuvole di punti. Questo approccio regolarizza congiuntamente le caratteristiche e le coordinate punto-punto verso un prior gaussiano, producendo un latente compatto che cattura tendenze strutturali grossolane senza geometria precisa. Il metodo combina l'espressività dei campi neurali impliciti con indizi geometrici espliciti, affrontando i limiti delle rappresentazioni sia completamente implicite che completamente esplicite nel pre-addestramento 3D. Il framework mira a migliorare le rappresentazioni visive per la percezione incarnata e i compiti di manipolazione.

Fatti principali

  • Il framework apprende punti latenti strutturali ibridi.
  • Inserisce un VAE latente punto-punto nello spazio latente di un autoencoder di nuvole di punti.
  • Le caratteristiche e le coordinate punto-punto sono regolarizzate verso un prior gaussiano.
  • Il latente risultante cattura tendenze strutturali grossolane e informazioni approssimative sulla forma.
  • Non codifica la geometria precisa.
  • Il metodo affronta i limiti delle rappresentazioni completamente implicite e completamente esplicite.
  • È progettato per la percezione incarnata e compiti di manipolazione.
  • L'articolo è disponibile su arXiv con ID 2605.21258.

Entità

Fonti