RC-aux: Una correzione leggera per la pianificazione con modelli del mondo latenti
Un nuovo articolo su arXiv (2605.07278) introduce l'obiettivo ausiliario di raggiungibilità-correzione (RC-aux) per affrontare il disallineamento spazio-temporale nei modelli del mondo latenti. Questi modelli ottengono previsioni accurate a breve termine, ma producono spazi latenti scarsamente allineati con la pianificazione a lungo termine, dove la distanza euclidea potrebbe non riflettere la raggiungibilità entro un budget di azioni finito. RC-aux aggiunge una supervisione allineata alla pianificazione lungo due assi: previsione multi-orizzonte a ciclo aperto lungo l'asse temporale e supervisione di raggiungibilità condizionata al budget con hard negativi temporali lungo l'asse spaziale. Questa correzione mantiene invariata l'architettura del modello del mondo ed è progettata per modelli del mondo latenti senza ricostruzione. L'approccio mira a distinguere gli stati che sono eventualmente raggiungibili, migliorando la ricerca orientata agli obiettivi.
Fatti principali
- 1. L'articolo arXiv:2605.07278 introduce RC-aux per modelli del mondo latenti.
- 2. RC-aux affronta il disallineamento spazio-temporale nella pianificazione.
- 3. I modelli del mondo latenti spesso hanno uno scarso allineamento con la pianificazione a lungo termine.
- 4. RC-aux aggiunge una previsione multi-orizzonte a ciclo aperto lungo l'asse temporale.
- 5. Viene aggiunta una supervisione di raggiungibilità condizionata al budget lungo l'asse spaziale.
- 6. Vengono utilizzati hard negativi temporali per distinguere gli stati raggiungibili.
- 7. RC-aux è una correzione leggera che mantiene invariata l'architettura.
- 8. Il metodo è mirato a modelli del mondo latenti senza ricostruzione.
Entità
Istituzioni
- arXiv