Un Framework di Apprendimento per Rinforzo Abilita il Controllo Multi-Task Adattivo per Robot Calciatori Bipedi
È stato sviluppato un framework modulare di apprendimento per rinforzo per affrontare le sfide della stabilità del movimento e del cambio di controllo nei robot calciatori bipedi che operano in ambienti di combattimento dinamici. Il sistema combina un oscillatore feedforward ad anello aperto con residui di feedback basati sull'apprendimento per rinforzo, separando efficacemente la generazione dell'andatura di base dalle azioni calcistiche complesse. Una macchina a stati guidata dalla postura passa chiaramente tra la rete di ricerca e calcio della palla (BSKN) e la rete di recupero dalla caduta (FRN), prevenendo interferenze di stato. La FRN viene addestrata attraverso una strategia di apprendimento curricolare con attenuazione progressiva della forza. Questa architettura è stata verificata in simulazioni Unity, affrontando problemi relativi all'accoppiamento profondo di più compiti e alle transizioni tra stati come la camminata eretta e il recupero dalla caduta. L'approccio affronta fondamentalmente i problemi di cambio di controllo tra diversi stati operativi.
Fatti principali
- Un framework modulare di apprendimento per rinforzo abilita il controllo multi-task adattivo per robot calciatori bipedi
- Il sistema combina oscillatori feedforward ad anello aperto con residui di feedback basati sull'apprendimento per rinforzo
- La generazione dell'andatura di base è separata dalle azioni calcistiche complesse
- Una macchina a stati guidata dalla postura passa tra le reti di ricerca/calcio della palla e di recupero dalla caduta
- La rete di recupero dalla caduta utilizza l'apprendimento curricolare con attenuazione progressiva della forza
- L'architettura previene interferenze di stato tra diverse modalità operative
- Il sistema affronta le sfide della stabilità del movimento e dell'accoppiamento profondo in ambienti di combattimento dinamici
- Il framework è stato verificato in simulazioni Unity
Entità
Istituzioni
- arXiv