Studio Contesta i Benefici dell'Augmentazione al Tempo di Test nella Classificazione di Immagini Mediche
Una recente indagine empirica pubblicata su arXiv mette in discussione la convinzione comune che l'augmentazione al tempo di test (TTA) migliori l'accuratezza di classificazione nell'imaging medico. Lo studio ha analizzato tre benchmark MedMNIST v2 e valutato quattro architetture di reti neurali, con parametri variabili da 21.000 a 11 milioni. Contrariamente alle pratiche consolidate negli ambienti di produzione e nei framework competitivi, i risultati hanno rivelato che la TTA utilizzando metodi di augmentazione standard riduceva costantemente l'accuratezza rispetto all'inferenza a passaggio singolo. Il declino più significativo è stato osservato a 31,6 punti percentuali per ResNet-18 sulle immagini patologiche. Questo declino era evidente in tutti i modelli convoluzionali testati e si intensificava con l'aggiunta di più viste augmentate, ad eccezione di ResNet-18 sulle immagini dermatologiche, che ha registrato un leggero aumento dell'1,6%. La ricerca evidenzia come gli spostamenti di distribuzione tra i dati augmentati e quelli del tempo di addestramento siano un fattore cruciale alla base di questi risultati sorprendenti, sollecitando una rivalutazione delle pratiche standard nei sistemi di imaging medico che implementano ampiamente la TTA.
Fatti principali
- L'augmentazione al tempo di test (TTA) è ampiamente ritenuta migliorare l'accuratezza di classificazione nell'imaging medico
- Lo studio ha esaminato tre benchmark MedMNIST v2 e quattro architetture di reti neurali
- Le architetture spaziavano su tre ordini di grandezza nel conteggio dei parametri (da 21K a 11M)
- La TTA con pipeline di augmentazione standard degrada costantemente l'accuratezza rispetto all'inferenza a passaggio singolo
- Il calo più severo è stato di 31,6 punti percentuali per ResNet-18 sulle immagini patologiche
- Il degrado interessa tutte le architetture, inclusi i modelli convoluzionali
- Le prestazioni peggiorano con più viste augmentate
- L'unica eccezione è stata ResNet-18 sulle immagini dermatologiche con un modesto guadagno dell'1,6%
Entità
Istituzioni
- arXiv