Robot Umanoidi Padroneggiano Cinque Andature Distinte Tramite Priorità di Movimento Adversariale Selettiva
Un framework unificato di apprendimento per rinforzo consente a un robot umanoide di padroneggiare cinque andature distinte: camminata, passo dell'oca, corsa, salita delle scale e salto. L'approccio utilizza una strategia selettiva di Priorità di Movimento Adversariale (AMP), applicando AMP alle andature periodiche e critiche per la stabilità come camminata e salita delle scale per accelerare la convergenza e sopprimere comportamenti erratici. Per andature altamente dinamiche come corsa e salto, AMP viene deliberatamente omesso per evitare di vincolare eccessivamente il movimento. Le politiche vengono addestrate tramite Ottimizzazione Prossimale delle Politiche con randomizzazione del dominio in simulazione prima del dispiegamento su un robot umanoide fisico a 12 gradi di libertà. La ricerca affronta il conflitto impegnativo tra stabilità ed espressività dinamica attraverso diverse abilità di locomozione. Il lavoro dimostra che una struttura politica coerente, uno spazio d'azione e una formulazione di ricompensa possono gestire requisiti di andatura diversi. Questo approccio di apprendimento multi-andatura è stato documentato nella preprint arXiv 2604.19102v1, annunciato come abstract interdisciplinare. La strategia selettiva AMP rappresenta il contributo chiave, mostrando come una regolarizzazione mirata possa ottimizzare l'apprendimento per caratteristiche specifiche dell'andatura.
Fatti principali
- Robot umanoide padroneggia cinque andature distinte: camminata, passo dell'oca, corsa, salita delle scale e salto
- Utilizza una strategia selettiva di Priorità di Movimento Adversariale (AMP)
- AMP applicato alle andature periodiche e critiche per la stabilità (camminata, passo dell'oca, salita delle scale)
- AMP omesso per le andature altamente dinamiche (corsa, salto)
- Politiche addestrate tramite PPO con randomizzazione del dominio in simulazione
- Dispiegato su robot umanoide fisico a 12 gradi di libertà
- Affronta il conflitto tra stabilità ed espressività dinamica attraverso le andature
- Documentato nella preprint arXiv 2604.19102v1
Entità
—