CLOVER: Stima a Ciclo Chiuso del Valore per la Pianificazione nella Guida Autonoma
Per affrontare la discrepanza tra addestramento e valutazione nei pianificatori di guida autonoma end-to-end, i ricercatori hanno introdotto CLOVER, un framework di Stima e Classifica del Valore a Ciclo Chiuso. I pianificatori convenzionali si basano sull'imitazione di una singola traiettoria registrata per l'addestramento, ma valutano le prestazioni utilizzando metriche basate su regole come sicurezza, fattibilità, progresso e comfort. Ciò crea una situazione in cui le traiettorie che assomigliano molto al percorso registrato possono violare le regole, mentre quelle che se ne discostano possono comunque essere valide e ottenere punteggi elevati. CLOVER impiega un approccio generatore-valutatore semplificato: il generatore crea una varietà di traiettorie candidate, e il valutatore stima i punteggi parziali delle metriche di pianificazione per la classifica durante l'inferenza. Ciò migliora il supporto delle proposte oltre la semplice imitazione di una singola traiettoria. Il framework sviluppa anche un valutatore per aumentare la copertura dell'insieme di candidati e la qualità della classifica del valutatore, aspetto cruciale per i pianificatori basati sulla selezione di proposte. La ricerca è pubblicata su arXiv (2605.15120).
Fatti principali
- CLOVER sta per Stima e Classifica del Valore a Ciclo Chiuso.
- Affronta la discrepanza tra addestramento e valutazione nella pianificazione della guida autonoma.
- I pianificatori tradizionali imitano una singola traiettoria registrata.
- La valutazione utilizza metriche basate su regole: sicurezza, fattibilità, progresso, comfort.
- CLOVER utilizza una formulazione generatore-valutatore.
- Il generatore produce diverse traiettorie candidate.
- Il valutatore prevede i punteggi parziali delle metriche di pianificazione per la classifica.
- Il framework migliora la copertura dell'insieme di candidati e la qualità della classifica del valutatore.
Entità
Istituzioni
- arXiv