MESD: Nuova Metrica Rileva Spiegazioni Ingiuste tra Gruppi Intersezionali
È stata sviluppata una nuova metrica denominata Multi-category Explanation Stability Disparity (MESD) per valutare l'ingiustizia presente nelle spiegazioni di machine learning tra vari sottogruppi intersezionali. A differenza delle metriche tradizionali basate sugli esiti, come la parità demografica, che valutano solo la coerenza statistica delle previsioni tra gruppi protetti, MESD enfatizza l'equità procedurale analizzando le differenze nella qualità delle spiegazioni. Affronta il problema del fairness gerrymandering, in cui i modelli possono sembrare equi in base a caratteristiche individuali (es. razza) ma rivelare disparità sostanziali per sottogruppi intersezionali (es. razza × genere). MESD incorpora tre elementi per misurare la stabilità delle spiegazioni tra sottogruppi derivati dal prodotto cartesiano di più attributi protetti. Questa metrica è descritta in un articolo disponibile su arXiv (2603.13452).
Fatti principali
- MESD sta per Multi-category Explanation Stability Disparity.
- È una metrica di equità procedurale per il machine learning.
- Rileva disparità nella qualità delle spiegazioni tra sottogruppi intersezionali.
- I sottogruppi intersezionali sono formati dal prodotto cartesiano di attributi protetti.
- Affronta il fairness gerrymandering, dove i modelli appaiono equi su singoli attributi.
- Metriche tradizionali come la parità demografica controllano solo la coerenza degli esiti.
- L'articolo è disponibile su arXiv con ID 2603.13452.
- MESD integra tre componenti per misurare la stabilità delle spiegazioni.
Entità
Istituzioni
- arXiv