OmniOVCD: Un Nuovo Framework per il Rilevamento di Cambiamenti a Vocabolario Aperto che Utilizza SAM 3
Un articolo di ricerca su arXiv presenta OmniOVCD, un framework autonomo per il Rilevamento di Cambiamenti a Vocabolario Aperto (OVCD) nel telerilevamento. Il framework sfrutta il Segment Anything Model 3 (SAM 3), che integra segmentazione e identificazione in un unico modello promptabile. I metodi OVCD esistenti senza addestramento spesso si basano su CLIP per l'identificazione delle categorie e su modelli aggiuntivi come DINO per l'estrazione delle caratteristiche, causando disallineamento delle caratteristiche e instabilità. OmniOVCD propone una strategia di Fusione Sinergica per il Disaccoppiamento delle Istanze (SFID) che fonde le informazioni semantiche dalle testine di output disaccoppiate di SAM 3. Questo approccio semplifica il pipeline OVCD eliminando la necessità di più modelli, migliorando stabilità e prestazioni. L'articolo è pubblicato su arXiv con ID 2601.13895.
Fatti principali
- OmniOVCD è un framework autonomo per il Rilevamento di Cambiamenti a Vocabolario Aperto (OVCD).
- Utilizza il Segment Anything Model 3 (SAM 3), che integra segmentazione e identificazione.
- I metodi OVCD esistenti senza addestramento usano CLIP e DINO, causando disallineamento delle caratteristiche.
- La strategia SFID fonde le informazioni semantiche dalle testine di output disaccoppiate di SAM 3.
- L'articolo è disponibile su arXiv con ID 2601.13895.
Entità
Istituzioni
- arXiv