MARL migliora il realismo nei test di sicurezza per la guida autonoma con l'incertezza dei pedoni

ai-technology · 2026-05-22

Una recente pubblicazione su arXiv (2605.20255) suggerisce che l'apprendimento per rinforzo multi-agente (MARL) può migliorare la valutazione basata su simulazione delle auto a guida autonoma (SDC) tenendo conto dell'incertezza nel comportamento dei pedoni. Le simulazioni convenzionali spesso utilizzano modelli scriptati o semplificati dei pedoni, che non riflettono accuratamente la diversità delle azioni umane, in particolare nelle situazioni di attraversamento irregolare influenzate da tratti di personalità sottostanti. Lo studio prevede l'addestramento congiunto di una SDC insieme a 12 pedoni tramite Multi-Agent Proximal Policy Optimization (MAPPO). Mentre il movimento dei pedoni segue il pathfinding scriptato di Dijkstra, una politica RL governa le decisioni di alto livello relative all'attraversamento. I ricercatori ritengono che MARL possa produrre interazioni più autentiche rispetto alle politiche statiche dei pedoni e che la disparità di comportamento tra attraversamenti prevedibili e imprevedibili possa essere valutata attraverso le traiettorie. Questa ricerca mira a migliorare il realismo delle valutazioni di sicurezza per i veicoli autonomi.

Fatti principali

L'articolo arXiv 2605.20255 propone MARL per i test di sicurezza delle SDC
Addestra congiuntamente SDC e 12 pedoni usando MAPPO
I pedoni usano pathfinding di Dijkstra con politica RL per l'attraversamento
Affronta scenari di attraversamento irregolare con tratti di personalità latenti
Mira a misurare il divario comportamentale tra attraversamenti prevedibili e imprevedibili
Critica i modelli di pedoni scriptati per la mancanza di eterogeneità
Si concentra sul realismo dei test basati su simulazione
Pubblicato come annuncio cross-type su arXiv

MARL migliora il realismo nei test di sicurezza per la guida autonoma con l'incertezza dei pedoni

Fatti principali

Entità

Istituzioni

Fonti