RoBERTa Multi-Testa con Chunking per il Rilevamento di Evasioni Politiche
Ricercatori della National University of Singapore e dell'Università di Bucarest hanno creato un sistema per il SemEval-2026 Task 6, intitolato CLARITY: Unmasking Political Question Evasions. Questo compito si concentra sulla categorizzazione di risposte a interviste politiche in inglese in base alla chiarezza a grana grossa (3 classi) e alla strategia di evasione a grana fine (9 classi). Per gestire risposte che superano il limite di 512 token dei codificatori Transformer standard, hanno utilizzato un metodo di chunking a finestra scorrevole con sovrapposizione e aggregazione tramite Max-Pooling elemento per elemento per le rappresentazioni dei chunk. Un codificatore condiviso RoBERTa-large presenta due teste specifiche per compito, addestrate insieme con un obiettivo multi-task, con convalida incrociata stratificata a 7 pieghe utilizzata durante l'ensemble in fase di inferenza. Il loro sistema ha ottenuto un punteggio Macro-F1 di 0,80 per il Subtask 1 e 0,51 per il Subtask 2, classificandosi 11° in entrambe le categorie.
Fatti principali
- Sistema sviluppato per SemEval-2026 Task 6 (CLARITY)
- Classifica le risposte a interviste politiche in inglese per chiarezza (3 classi) e strategia di evasione (9 classi)
- Utilizza chunking a finestra scorrevole con sovrapposizione e aggregazione Max-Pooling
- Codificatore condiviso RoBERTa-large con due teste specifiche per compito
- Obiettivo multi-task con ensemble in fase di inferenza su convalida incrociata stratificata a 7 pieghe
- Macro-F1 di 0,80 sul Subtask 1 e 0,51 sul Subtask 2
- Classificato 11° in entrambi i subtask
- Team della National University of Singapore e dell'Università di Bucarest
Entità
Istituzioni
- National University of Singapore
- University of Bucharest
- SemEval
Luoghi
- Singapore
- Bucharest
- Romania