FairEnc: Un Modello Linguistico-Visivo Equo per la Rilevazione del Glaucoma
I ricercatori hanno introdotto FairEnc, un approccio di pre-addestramento equo per modelli linguistico-visivi (VLM) progettato per facilitare la rilevazione automatizzata del glaucoma. Questa tecnica mitiga contemporaneamente i bias legati a caratteristiche sensibili come razza, genere, etnia e lingua, sia nel testo che nelle immagini. Nell'encoder testuale, un modello linguistico di grandi dimensioni genera descrizioni cliniche sintetiche che incorporano diversi attributi sensibili, mantenendo l'essenza della malattia, utilizzando l'allineamento contrastivo per promuovere rappresentazioni invarianti rispetto ai dati demografici. Per l'encoder visivo, viene applicata una strategia di equità a doppio livello che integra la regolarizzazione dell'informazione mutua. Questa iniziativa affronta le questioni di equità nell'assistenza sanitaria basata sull'IA, in particolare negli sforzi per prevenire la perdita irreversibile della vista dovuta al glaucoma.
Fatti principali
- FairEnc è un metodo di pre-addestramento equo per modelli linguistico-visivi.
- È mirato alla rilevazione automatizzata del glaucoma.
- La debiasing avviene su più attributi sensibili: razza, genere, etnia e lingua.
- L'encoder testuale utilizza descrizioni cliniche sintetiche generate da LLM.
- L'obiettivo di allineamento contrastivo incoraggia rappresentazioni invarianti rispetto ai dati demografici.
- L'encoder visivo utilizza una strategia di equità a doppio livello con regolarizzazione dell'informazione mutua.
- Il metodo affronta l'equità nelle applicazioni sanitarie basate sull'IA.
- Pubblicato su arXiv con ID 2605.04882.
Entità
Istituzioni
- arXiv