HaM-World: Modello del Mondo Strutturato per una Pianificazione Stabile
Un nuovo studio ha presentato HaM-World (HMW), un modello strutturato progettato per migliorare la stabilità nella pianificazione basata su modelli. I ricercatori sostengono che l'instabilità osservata nelle simulazioni di rollout deriva dalla mancanza di struttura nei latenti utilizzati dai pianificatori, in particolare nella memoria che si basa sulla storia per garantire la completezza markoviana. HMW separa lo stato latente in due parti: un sottospazio canonico (q, p) e un sottospazio di contesto c, utilizzando la memoria state-space di Mamba per l'input storico. Il sottospazio (q, p) si evolve attraverso un campo vettoriale hamiltoniano guidato dall'energia, mentre il contesto include vari elementi semantici. Questo metodo fornisce ai pianificatori uno stato latente coeso per prevedere le dinamiche e calcolare le ricompense. Lo studio è disponibile su arXiv con ID 2605.05951.
Fatti principali
- HaM-World (HMW) è un modello del mondo strutturato per la pianificazione.
- Affronta l'instabilità nei rollout immaginati dovuta alla mancanza di memoria condizionata dalla storia e di organizzazione geometrica.
- Lo stato latente è scomposto in un sottospazio (q, p) e un sottospazio di contesto c.
- La memoria selettiva state-space di Mamba fornisce input condizionato dalla storia.
- (q, p) si evolve tramite un campo vettoriale hamiltoniano più dinamiche residue/di controllo.
- c cattura fattori semantici, dissipativi e non conservativi.
- Il modello fornisce un unico stato latente per la previsione delle dinamiche e la ricompensa.
- L'articolo è su arXiv con ID 2605.05951.
Entità
Istituzioni
- arXiv