MARL migliora il realismo nei test di sicurezza per la guida autonoma con l'incertezza dei pedoni
Una recente pubblicazione su arXiv (2605.20255) suggerisce che l'apprendimento per rinforzo multi-agente (MARL) può migliorare la valutazione basata su simulazione delle auto a guida autonoma (SDC) tenendo conto dell'incertezza nel comportamento dei pedoni. Le simulazioni convenzionali spesso utilizzano modelli scriptati o semplificati dei pedoni, che non riflettono accuratamente la diversità delle azioni umane, in particolare nelle situazioni di attraversamento irregolare influenzate da tratti di personalità sottostanti. Lo studio prevede l'addestramento congiunto di una SDC insieme a 12 pedoni tramite Multi-Agent Proximal Policy Optimization (MAPPO). Mentre il movimento dei pedoni segue il pathfinding scriptato di Dijkstra, una politica RL governa le decisioni di alto livello relative all'attraversamento. I ricercatori ritengono che MARL possa produrre interazioni più autentiche rispetto alle politiche statiche dei pedoni e che la disparità di comportamento tra attraversamenti prevedibili e imprevedibili possa essere valutata attraverso le traiettorie. Questa ricerca mira a migliorare il realismo delle valutazioni di sicurezza per i veicoli autonomi.
Fatti principali
- L'articolo arXiv 2605.20255 propone MARL per i test di sicurezza delle SDC
- Addestra congiuntamente SDC e 12 pedoni usando MAPPO
- I pedoni usano pathfinding di Dijkstra con politica RL per l'attraversamento
- Affronta scenari di attraversamento irregolare con tratti di personalità latenti
- Mira a misurare il divario comportamentale tra attraversamenti prevedibili e imprevedibili
- Critica i modelli di pedoni scriptati per la mancanza di eterogeneità
- Si concentra sul realismo dei test basati su simulazione
- Pubblicato come annuncio cross-type su arXiv
Entità
Istituzioni
- arXiv