Anatomy-Slot: Apprendimento Profondo Non Supervisionato per la Diagnosi Retinica tramite Confronto Bilaterale degli Occhi
Un nuovo approccio di deep learning chiamato Anatomy-Slot è stato introdotto dai ricercatori per migliorare la diagnostica retinica confrontando direttamente strutture simili in entrambi gli occhi, simile a come operano i clinici. Questo modello presenta un collo di bottiglia anatomico non supervisionato che scompone i token di patch in slot, allineandoli tramite attenzione incrociata bidirezionale. Testato sul dataset ODIR-5K, Anatomy-Slot ha mostrato un aumento del 4,2% nell'AUC rispetto a una corrispondente baseline ViT-L (IC 95%; test dei ranghi con segno di Wilcoxon, W=0, p=0,002). Esperimenti aggiuntivi hanno incluso la perturbazione dell'accoppiamento, test di stress con rumore gaussiano, grounding quantitativo del disco ottico su REFUGE e analisi della localizzazione dell'attenzione incrociata. Questa ricerca è stata pubblicata su arXiv nel campo della visione artificiale e del riconoscimento di pattern.
Fatti principali
- Anatomy-Slot migliora l'AUC del 4,2% rispetto alla baseline ViT-L su ODIR-5K
- Utilizza un collo di bottiglia anatomico non supervisionato con decomposizione in slot e attenzione incrociata
- Testato sotto rumore gaussiano per robustezza
- Grounding del disco ottico valutato sul dataset REFUGE
- Pubblicato su arXiv nella categoria computer vision
Entità
Istituzioni
- arXiv