L'Apprendimento con Etichette Soft Migliora la Scomposizione dell'Incertezza nella NLP Soggettiva
Un nuovo metodo che combina il Markov chain Monte Carlo stocastico ciclico (cSG-MCMC) con l'apprendimento con etichette soft migliora la scomposizione dell'incertezza in compiti di NLP soggettiva. L'approccio addestra una testa lineare su un modello RoBERTa congelato, mirando alle distribuzioni empiriche degli annotatori. Sul benchmark GoEmotions, supera Monte Carlo Dropout e Deep Ensemble in tre assi di valutazione: divergenza di Jensen-Shannon rispetto alla distribuzione degli annotatori, correlazione di Spearman tra incertezza aleatoria e disaccordo, e AURC e AUROC per la previsione selettiva. Questo lavoro affronta il disaccordo tra annotatori nella classificazione delle emozioni, che riflette l'ambiguità intrinseca dei concetti emotivi, ed è il primo a integrare l'apprendimento con etichette soft con il deep learning bayesiano per una valutazione multi-asse dell'incertezza.
Fatti principali
- Il metodo utilizza SG-MCMC ciclico e apprendimento con etichette soft
- Testa lineare addestrata su RoBERTa congelato
- Mira alla distribuzione empirica degli annotatori
- Valutato sul benchmark GoEmotions con 28 emozioni
- Supera Monte Carlo Dropout e Deep Ensemble su tre assi
- Prima integrazione di apprendimento con etichette soft e deep learning bayesiano per la scomposizione dell'incertezza
- Affronta il disaccordo tra annotatori nella classificazione delle emozioni
- Quadro di valutazione a cinque assi
Entità
—