MemOVCD: Framework di Rilevamento dei Cambiamenti a Vocabolario Aperto Senza Addestramento
MemOVCD è un framework di rilevamento dei cambiamenti a vocabolario aperto senza addestramento per immagini remote sensing bitemporali, introdotto nell'articolo arXiv 2604.26774. Supera le limitazioni dei metodi esistenti che elaborano ogni timestamp in modo indipendente o interagiscono solo nella fase finale di confronto, portando a un accoppiamento temporale insufficiente e a regioni di cambiamento frammentate. Il framework riformula il rilevamento dei cambiamenti come un problema di tracciamento a due fotogrammi, utilizzando il ragionamento della memoria cross-temporale e la rettifica adattiva globale-locale. Sfrutta modelli fondamentali come SAM, DINO e CLIP senza richiedere addestramento. L'approccio mira a distinguere i cambiamenti semantici genuini dalle discrepanze di aspetto non semantiche e a mantenere la continuità semantica globale in immagini ad alta risoluzione.
Fatti principali
- MemOVCD è un framework senza addestramento per il rilevamento dei cambiamenti a vocabolario aperto.
- Utilizza il ragionamento della memoria cross-temporale e la rettifica adattiva globale-locale.
- Il framework riformula il rilevamento dei cambiamenti bitemporali come un problema di tracciamento a due fotogrammi.
- Sfrutta i modelli fondamentali SAM, DINO e CLIP.
- I metodi esistenti elaborano i timestamp in modo indipendente o interagiscono solo nella fase finale.
- L'approccio affronta l'accoppiamento temporale insufficiente e le regioni di cambiamento frammentate.
- Si rivolge a immagini remote sensing bitemporali.
- L'articolo è disponibile su arXiv con ID 2604.26774.
Entità
Istituzioni
- arXiv