DisDop Framework Migliora il Rilevamento di Oggetti Aerei a Vocabolario Aperto
Un nuovo approccio chiamato DisDop (Distillation with Domain Priors) è stato introdotto per rilevare oggetti aerei in un vocabolario aperto. Questa tecnica affronta il problema per cui i modelli convenzionali di rilevamento a vocabolario aperto, ottimizzati per immagini naturali, faticano con le foto aeree a causa delle differenze di prospettiva e della scarsità di dati disponibili. DisDop estrae efficacemente priorità di dominio multilivello da modelli fondativi di telerilevamento come RemoteCLIP e DINOv3, anziché basarsi esclusivamente su modelli addestrati su immagini naturali. L'obiettivo è migliorare la precisione del rilevamento per oggetti al di là di categorie fisse, una necessità con l'aumento dell'uso dei droni. I risultati sono descritti in un articolo disponibile su arXiv (ID: 2605.24639).
Fatti principali
- DisDop è un framework unificato per il rilevamento di oggetti aerei a vocabolario aperto.
- Distilla priorità di dominio multilivello da modelli fondativi di telerilevamento.
- I modelli fondativi utilizzati includono RemoteCLIP e DINOv3.
- I metodi standard di rilevamento a vocabolario aperto funzionano male su immagini aeree.
- L'approccio affronta la scarsità di immagini da punti di vista di droni.
- L'articolo è disponibile su arXiv con ID 2605.24639.
- La ricerca si concentra sul superamento delle differenze tra immagini naturali e aeree.
- DisDop mira a migliorare il rilevamento senza restrizioni di categoria predefinite.
Entità
Istituzioni
- arXiv