Co-Fusion4D: Un Nuovo Framework per il Rilevamento Robusto di Oggetti 3D nella Guida Autonoma
Un nuovo framework chiamato Co-Fusion4D è stato introdotto dai ricercatori per risolvere le incongruenze spazio-temporali nei rilevatori di oggetti 3D basati su Bird's Eye View (BEV) per veicoli autonomi. Affronta i disallineamenti derivanti sia dal movimento degli oggetti che dall'ego-motion attraverso diversi fotogrammi. Concentrandosi sul fotogramma corrente, Co-Fusion4D integra selettivamente i fotogrammi storici dopo un filtraggio e un allineamento spazio-temporale. Questo approccio minimizza gli errori di allineamento cumulativi, riduce la propagazione di caratteristiche rumorose e sfrutta segnali temporali affidabili per una rappresentazione BEV stabile. Inoltre, il framework presenta un'architettura a doppio flusso per aumentare la robustezza. Il documento dettagliato è disponibile su arXiv con il numero di riferimento 2605.20301.
Fatti principali
- Co-Fusion4D è un framework per il rilevamento di oggetti 3D nella guida autonoma.
- Affronta le incongruenze spazio-temporali nei rilevatori basati su BEV.
- Utilizza una strategia incentrata sul fotogramma corrente con integrazione selettiva dei fotogrammi storici.
- Riduce gli errori di allineamento cumulativi e la propagazione di caratteristiche rumorose.
- Integra un'architettura a doppio flusso.
- Documento disponibile su arXiv: 2605.20301.
Entità
Istituzioni
- arXiv