L'Apprendimento con Etichette Soft Migliora la Scomposizione dell'Incertezza nella NLP Soggettiva

other · 2026-05-26

Un nuovo metodo che combina il Markov chain Monte Carlo stocastico ciclico (cSG-MCMC) con l'apprendimento con etichette soft migliora la scomposizione dell'incertezza in compiti di NLP soggettiva. L'approccio addestra una testa lineare su un modello RoBERTa congelato, mirando alle distribuzioni empiriche degli annotatori. Sul benchmark GoEmotions, supera Monte Carlo Dropout e Deep Ensemble in tre assi di valutazione: divergenza di Jensen-Shannon rispetto alla distribuzione degli annotatori, correlazione di Spearman tra incertezza aleatoria e disaccordo, e AURC e AUROC per la previsione selettiva. Questo lavoro affronta il disaccordo tra annotatori nella classificazione delle emozioni, che riflette l'ambiguità intrinseca dei concetti emotivi, ed è il primo a integrare l'apprendimento con etichette soft con il deep learning bayesiano per una valutazione multi-asse dell'incertezza.

Fatti principali

Il metodo utilizza SG-MCMC ciclico e apprendimento con etichette soft
Testa lineare addestrata su RoBERTa congelato
Mira alla distribuzione empirica degli annotatori
Valutato sul benchmark GoEmotions con 28 emozioni
Supera Monte Carlo Dropout e Deep Ensemble su tre assi
Prima integrazione di apprendimento con etichette soft e deep learning bayesiano per la scomposizione dell'incertezza
Affronta il disaccordo tra annotatori nella classificazione delle emozioni
Quadro di valutazione a cinque assi

Entità

—

Fonti

arXiv cs.AI — 2026-05-26