Analisi del pathos basata su LLM supera il riconoscimento acustico delle emozioni nel discorso politico

other · 2026-05-23

Uno studio da arXiv (2605.22732) confronta modelli di riconoscimento acustico delle emozioni con modelli linguistici di grandi dimensioni (LLM) per analizzare il pathos nel discorso politico. Utilizzando un discorso al Bundestag di Felix Banaszak (51 segmenti, 245 secondi), i ricercatori hanno testato tre modalità: emotion2vec_plus_large (SER acustico con proiezione Russell Circumplex), Gemini 2.5 Flash (LLM che analizza audio e trascrizione) e TRUST-Pathos (ensemble supervisore multi-agente LLM). Le correlazioni di Spearman mostrano che Gemini Valence è fortemente correlato con TRUST-Pathos (rho=+0,664, p<0,001), mentre emotion2vec Valence no (rho=+0,097, p=0,499). Il pipeline TRUST utilizza tre avvocati LLM per il punteggio del pathos. I risultati suggeriscono che gli LLM sono proxy più efficaci per il pathos retorico rispetto ai modelli acustici tradizionali.

Fatti principali

Il paper arXiv 2605.22732 confronta il riconoscimento acustico delle emozioni e gli LLM per l'analisi del pathos nel discorso politico
Il caso di studio utilizza un discorso al Bundestag di Felix Banaszak (51 segmenti, 245 secondi)
Tre modalità testate: emotion2vec_plus_large, Gemini 2.5 Flash, TRUST-Pathos
Gemini Valence è fortemente correlato con TRUST-Pathos (rho=+0,664, p<0,001)
emotion2vec Valence non mostra correlazione significativa (rho=+0,097, p=0,499)
TRUST-Pathos utilizza un ensemble supervisore a tre avvocati LLM
Il modello SER acustico usa la proiezione post-hoc Russell Circumplex per Arousal e Valence
L'analisi basata su LLM supera i modelli acustici per il rilevamento del pathos

Entità

Istituzioni

arXiv
Bundestag
TRUST

Luoghi

Germany

Fonti

arXiv cs.AI — 2026-05-23