Etichette deboli di BiomedCLIP mostrano un netto crossover nei benchmark di imaging medico

other · 2026-05-26

Un recente articolo su arXiv esamina il punto in cui la supervisione debole da modelli visione-linguaggio passa dall'essere benefica a dannosa nel campo dell'imaging medico. La ricerca utilizza etichette deboli generate da BiomedCLIP su tre benchmark—PCAM, ISIC e NIH-CXR—e valuta sei architetture downstream con una variazione di parametri di 11x. I risultati indicano che il crossover avviene a circa 100 campioni per PCAM, 20-50 per ISIC e 250-500 per NIH-CXR. Oltre questi limiti, le etichette deboli possono ridurre l'AUC fino a -0,10. Questo punto di crossover rimane coerente in quattro delle cinque architetture pre-addestrate, e un'analisi DenseNet (2,5x parametri, stesso pre-addestramento) conferma le aspettative teoriche. Questo studio traduce la teoria tradizionale delle etichette rumorose in un quadro pratico per i moderni etichettatori basati su modelli foundation.

Fatti principali

1. Lo studio calibra il crossover delle etichette rumorose per le etichette deboli di BiomedCLIP
2. Tre benchmark utilizzati: PCAM, ISIC, NIH-CXR
3. Sei architetture downstream testate su un intervallo di parametri di 11x
4. Crossover a ~100 campioni su PCAM, 20-50 su ISIC, 250-500 su NIH-CXR
5. Le etichette deboli oltre il crossover degradano l'AUC fino a -0,10
6. La posizione del crossover è invariante rispetto all'architettura per quattro delle cinque architetture pre-addestrate
7. La scansione DenseNet (2,5x parametri, identico pre-addestramento) supporta la teoria
8. Trasforma la previsione teorica in un'affermazione a livello di istanza per gli etichettatori basati su modelli foundation

Etichette deboli di BiomedCLIP mostrano un netto crossover nei benchmark di imaging medico

Fatti principali

Entità

Istituzioni

Fonti