Pseudo-etichettatura potenziata dal dibattito per il rilevamento di oggetti mimetizzati debolmente supervisionato
Un nuovo framework a due fasi, D³ETOR, migliora il rilevamento di oggetti mimetizzati debolmente supervisionato (WSCOD) utilizzando annotazioni a scarabocchio. Il metodo affronta due limitazioni chiave: maschere pseudo inaffidabili da modelli di uso generale come SAM, che mancano di comprensione specifica del compito, e bias di annotazione negli scarabocchi che oscura la struttura globale dell'oggetto. La prima fase introduce una pseudo-etichettatura potenziata dal dibattito basata su entropia adattiva per generare maschere più affidabili. La seconda fase applica un debiasing progressivo sensibile alla frequenza per correggere il bias degli scarabocchi. L'approccio mira a colmare il divario tra i metodi COD debolmente e completamente supervisionati.
Fatti principali
- D³ETOR è un framework WSCOD a due fasi.
- La prima fase utilizza pseudo-etichettatura potenziata dal dibattito con entropia adattiva.
- La seconda fase applica un debiasing progressivo sensibile alla frequenza.
- Affronta maschere pseudo inaffidabili da SAM e altri modelli generali.
- Corregge il bias di annotazione nelle annotazioni a scarabocchio.
- Mira a migliorare la cattura della struttura globale degli oggetti mimetizzati.
- Pubblicato su arXiv con ID 2512.20260.
- Il tipo di annuncio è replace-cross.
Entità
Istituzioni
- arXiv