PRISM-WM: Un Modello del Mondo Strutturato per Dinamiche Ibride nei Robot
Una nuova architettura per la pianificazione basata su modelli in sistemi robotici con dinamiche ibride è stata presentata dai ricercatori, denominata Prismatic World Model (PRISM-WM). I modelli del mondo latente tradizionali si basano su reti neurali monolitiche che impongono una continuità globale, portando a un eccessivo smussamento delle diverse modalità dinamiche (come aderenza vs. scivolamento o volo vs. appoggio), con conseguenti errori cumulativi nelle previsioni a lungo termine. PRISM-WM contrasta questo problema scomponendo le complesse dinamiche ibride in primitive componibili attraverso un framework Mixture-of-Experts (MoE) sensibile al contesto. Questo framework include un meccanismo di gating che identifica la modalità fisica corrente, mentre esperti specializzati prevedono le corrispondenti dinamiche di transizione, migliorando infine l'affidabilità della pianificazione ai confini fisici.
Fatti principali
- PRISM-WM è progettato per la pianificazione basata su modelli in sistemi ibridi.
- Le dinamiche ibride coinvolgono movimento continuo punteggiato da eventi discreti.
- I modelli convenzionali smussano eccessivamente le modalità dinamiche distinte.
- PRISM-WM utilizza un framework Mixture-of-Experts.
- Un meccanismo di gating identifica la modalità fisica corrente.
- Esperti specializzati prevedono le dinamiche di transizione.
- L'architettura scompone le dinamiche in primitive componibili.
- L'articolo è disponibile su arXiv con ID 2512.08411.
Entità
Istituzioni
- arXiv