Allocazione Primale-Duale Online Previene il Collasso dell'Equità nell'SSL Tabulare
Un recente studio pubblicato su arXiv (2605.16446) rivela due modalità di fallimento nell'apprendimento semi-supervisionato per dati tabulari quando i vincoli di equità sono integrati con pseudo-etichettatura basata sulla confidenza. La prima modalità, Collasso per Mascheramento, si verifica quando la regolarizzazione dell'equità riduce la confidenza del modello, portando a una mancanza di pseudo-etichette. La seconda, Saturazione Banale, porta il modello a convergere verso predittori costanti. Per affrontare questi problemi, gli autori introducono l'Allocazione Primale-Duale Online (OPDA), un controllore online che regola in tempo reale le penalità di equità e stabilità basate sull'entropia, utilizzando segnali di violazione, rischio e salute delle pseudo-etichette. Testato sui dataset Adult, ACSIncome e COMPAS, OPDA affronta efficacemente i problemi osservati con pesi statici e metodi adattivi di base, particolarmente in aree critiche come la diagnosi medica e il credit scoring.
Fatti principali
- Il paper arXiv:2605.16446 identifica due modalità di fallimento nell'SSL equo per dati tabulari: Collasso per Mascheramento e Saturazione Banale.
- Il Collasso per Mascheramento si verifica quando la regolarizzazione dell'equità erode la confidenza, affamando le pseudo-etichette.
- La Saturazione Banale comporta una deriva verso predittori costanti sotto pseudo-etichettatura basata sulla confidenza.
- Viene proposta l'Allocazione Primale-Duale Online (OPDA) come controllore online per le penalità di equità ed entropia.
- OPDA utilizza segnali di violazione, rischio e salute delle pseudo-etichette per programmare dinamicamente le penalità.
- Valutato sui benchmark tabulari Adult, ACSIncome e COMPAS.
- OPDA mitiga i regimi degenerati rispetto a pesi statici e baseline adattive semplici.
- Il lavoro si rivolge ad applicazioni ad alto rischio: previsione medica, creditizia e di recidiva.
Entità
Istituzioni
- arXiv