Il Modello STELLAR Stabilisce un Nuovo Punto di Riferimento nella Percezione per la Guida Autonoma
Un nuovo modello di percezione 3D chiamato STELLAR è stato presentato dai ricercatori, raggiungendo prestazioni di alto livello nella sfida del dataset Waymo Open per la guida autonoma. Utilizzando un Sparse Window Transformer, questo modello combina input provenienti da LiDAR, radar, telecamere e dati cartografici. È stato addestrato su 50 milioni di scenari di guida e possiede fino a 500 milioni di parametri. La ricerca esamina approfonditamente le tendenze di scaling, collegando le prestazioni del modello alla sua dimensione, ai dati e alle risorse computazionali. STELLAR supera gli approcci precedenti, dimostrando che le strategie di scaling possono migliorare efficacemente la percezione nella guida autonoma, nonostante le difficoltà legate alla fusione dei sensori e alla comprensione dei contesti spaziali 3D.
Fatti principali
- STELLAR è un modello di percezione 3D per la guida autonoma.
- Si basa sull'architettura Sparse Window Transformer.
- Le modalità di input includono LiDAR, radar, telecamera e mappa prioritaria.
- Addestrato su 50 milioni di esempi di guida.
- Il modello ha fino a 500 milioni di parametri.
- Raggiunge lo stato dell'arte nella sfida del dataset Waymo Open.
- Supera le tecniche precedenti nella percezione per la guida autonoma.
- Lo studio rivela tendenze empiriche di scaling tra prestazioni del modello e dimensione, dati e potenza di calcolo.
Entità
Istituzioni
- Waymo Open Dataset