Framework di Apprendimento Inverso Neuro-Ispirato per la Pianificazione Embodied
Un nuovo framework di IA chiamato Inverter, ispirato ai principi del cervello dei mammiferi, è stato introdotto per la pianificazione e il controllo embodied. Utilizza l'Apprendimento Inverso (IL), un metodo distinto dall'apprendimento supervisionato, per rinforzo e per imitazione, per colmare il divario tra l'ammortizzazione a passo singolo e il controllo ottimale su traiettorie complete. Il framework impiega modelli forward/inversi accoppiati, comandi multi-step a ciclo aperto e organizzazione gerarchica delle azioni. Nei test su compiti maze2d, stack Inverter singoli o a due livelli hanno eguagliato o superato le baseline offline-RL e diffusion-planner. L'articolo è disponibile su arXiv.
Fatti principali
- Framework denominato Inverter
- Basato su tre principi del cervello dei mammiferi: modelli forward/inversi accoppiati, comandi multi-step a ciclo aperto, organizzazione gerarchica delle azioni
- Utilizza l'Apprendimento Inverso (IL) addestrato end-to-end
- IL colma il divario tra l'ammortizzazione stile Reinforcement Learning e la pianificazione sequenziale stile Controllo Ottimale
- Testati Inverter singoli o stack gerarchici n=2
- Hanno eguagliato o migliorato le baseline offline-RL e diffusion-planner su tutti e 3 i compiti maze2d
- Articolo disponibile su arXiv con ID 2605.24152
Entità
Istituzioni
- arXiv