AutoScale: Miscela di Dati a Ciclo Chiuso per il Co-Training Reale-Sintetico nella Guida Autonoma
Un nuovo articolo su arXiv (2605.21372) propone AutoScale, un motore dati a ciclo chiuso che ottimizza dinamicamente la miscela di dati di guida reali e sintetici per modelli di guida autonoma end-to-end. Gli autori sostengono che l'incorporazione ingenua di tutti i dati sintetici disponibili è inefficiente e causa spostamenti di distribuzione. AutoScale regola iterativamente la miscela di dati di training basandosi sul feedback di valutazione per massimizzare le prestazioni del modello entro budget di training pratici. Il lavoro affronta il problema poco esplorato dell'ottimizzazione della miscela di dati per il co-training reale-sintetico, mirando a sfruttare dati sintetici quasi infiniti mitigando al contempo i bias di scena e i costi di annotazione dei dati reali.
Fatti principali
- ID articolo: arXiv:2605.21372
- Titolo: Miscela di Dati di Guida Dinamica a Ciclo Chiuso per il Co-Training Reale-Sintetico
- Propone AutoScale, un motore dati a ciclo chiuso completamente automatizzato
- Affronta il data scaling per la guida autonoma end-to-end
- I dati reali sono costosi da annotare e presentano bias di scena
- L'inclusione ingenua di dati sintetici porta a spostamenti di distribuzione
- Ottimizza iterativamente la miscela di dati tramite feedback di valutazione
- Si concentra su budget di training pratici
Entità
Istituzioni
- arXiv