Guida esperta consapevole dell'incertezza per un apprendimento per rinforzo più sicuro nella guida autonoma

other · 2026-06-01

Un nuovo framework per l'apprendimento per rinforzo nella guida autonoma migliora la sicurezza durante l'esplorazione utilizzando consigli esperti attivati da soglie di incertezza. Questo approccio, descritto in arXiv:2605.30576, incorpora soglie adattive da buffer mobili per attivare la guida quando l'incertezza epistemica o aleatoria è elevata. Per gestire la durata e la frequenza dei consigli, viene implementata una strategia di impegno-raffreddamento con arresto anticipato stocastico, minimizzando il rischio di eccessiva dipendenza. Le esperienze sia degli esperti che degli agenti sono integrate in un buffer di replay condiviso, supportato da un backbone di rete quantile implicita (IQN) off-policy. I test nel simulatore CARLA dimostrano che questo metodo supera la baseline IQN, riducendo efficacemente collisioni e uscite di strada, preservando al contempo l'efficienza dell'apprendimento.

Fatti principali

Il framework utilizza consigli esperti consapevoli dell'incertezza per guidare l'esplorazione nell'apprendimento per rinforzo per la guida autonoma.
I consigli vengono attivati quando l'incertezza epistemica o aleatoria supera soglie adattive da buffer mobili.
Una strategia di impegno-raffreddamento con euristica di arresto anticipato stocastico regola la durata e la frequenza dei consigli.
Le esperienze di esperti e agenti sono combinate in un buffer di replay condiviso all'interno di un backbone IQN off-policy.
Gli esperimenti nel simulatore CARLA mostrano che il metodo supera la baseline IQN.
Mira a ridurre collisioni e uscite di strada durante l'esplorazione.
Pubblicato su arXiv con ID 2605.30576.
Affronta l'insicurezza intrinseca dell'esplorazione nell'apprendimento per rinforzo per la guida autonoma.

Guida esperta consapevole dell'incertezza per un apprendimento per rinforzo più sicuro nella guida autonoma

Fatti principali

Entità

Istituzioni

Fonti