RoBERTa Multi-Testa con Chunking per il Rilevamento di Evasioni Politiche

other · 2026-04-30

Ricercatori della National University of Singapore e dell'Università di Bucarest hanno creato un sistema per il SemEval-2026 Task 6, intitolato CLARITY: Unmasking Political Question Evasions. Questo compito si concentra sulla categorizzazione di risposte a interviste politiche in inglese in base alla chiarezza a grana grossa (3 classi) e alla strategia di evasione a grana fine (9 classi). Per gestire risposte che superano il limite di 512 token dei codificatori Transformer standard, hanno utilizzato un metodo di chunking a finestra scorrevole con sovrapposizione e aggregazione tramite Max-Pooling elemento per elemento per le rappresentazioni dei chunk. Un codificatore condiviso RoBERTa-large presenta due teste specifiche per compito, addestrate insieme con un obiettivo multi-task, con convalida incrociata stratificata a 7 pieghe utilizzata durante l'ensemble in fase di inferenza. Il loro sistema ha ottenuto un punteggio Macro-F1 di 0,80 per il Subtask 1 e 0,51 per il Subtask 2, classificandosi 11° in entrambe le categorie.

Fatti principali

Sistema sviluppato per SemEval-2026 Task 6 (CLARITY)
Classifica le risposte a interviste politiche in inglese per chiarezza (3 classi) e strategia di evasione (9 classi)
Utilizza chunking a finestra scorrevole con sovrapposizione e aggregazione Max-Pooling
Codificatore condiviso RoBERTa-large con due teste specifiche per compito
Obiettivo multi-task con ensemble in fase di inferenza su convalida incrociata stratificata a 7 pieghe
Macro-F1 di 0,80 sul Subtask 1 e 0,51 sul Subtask 2
Classificato 11° in entrambi i subtask
Team della National University of Singapore e dell'Università di Bucarest

Entità

Istituzioni

National University of Singapore
University of Bucharest
SemEval

Luoghi

Singapore
Bucharest
Romania

Fonti

arXiv cs.AI — 2026-04-30