Metrica di Equità per il Riconoscimento delle Emozioni Vocali Mira al Pregiudizio Demografico
Un nuovo approccio alla modellazione dell'equità nei sistemi di Riconoscimento delle Emozioni Vocali (SER) identifica efficacemente il pregiudizio allocativo analizzando l'interconnessione tra fattori demografici e imprecisioni del modello. Questa tecnica supera le carenze delle metriche di equità convenzionali come le Probabilità Equalizzate e la Parità Demografica, che non tengono conto delle dipendenze congiunte. Testata su dati sintetici, la metrica è stata utilizzata per valutare i modelli HuBERT e WavLM, ottimizzati sul dataset CREMA-D. I risultati indicano che il nuovo modello cattura una maggiore informazione mutua tra attributi protetti e pregiudizi, consentendo di quantificare i contributi dei singoli attributi. L'analisi suggerisce anche la presenza di pregiudizio di genere sia nei modelli HuBERT che WavLM.
Fatti principali
- 1. arXiv:2604.19763v1
- 2. I sistemi di Riconoscimento delle Emozioni Vocali (SER) hanno applicazioni nella salute mentale e nell'istruzione
- 3. Le metriche di equità tradizionali includono Probabilità Equalizzate e Parità Demografica
- 4. Il modello di equità proposto cattura la relazione congiunta tra attributi demografici ed errore del modello
- 5. Validato su dati sintetici
- 6. Applicato ai modelli HuBERT e WavLM
- 7. Ottimizzato sul dataset CREMA-D
- 8. Indizi di pregiudizio di genere trovati sia in HuBERT che in WavLM
Entità
Istituzioni
- arXiv
- CREMA-D