Analisi del pathos basata su LLM supera il riconoscimento acustico delle emozioni nel discorso politico
Uno studio da arXiv (2605.22732) confronta modelli di riconoscimento acustico delle emozioni con modelli linguistici di grandi dimensioni (LLM) per analizzare il pathos nel discorso politico. Utilizzando un discorso al Bundestag di Felix Banaszak (51 segmenti, 245 secondi), i ricercatori hanno testato tre modalità: emotion2vec_plus_large (SER acustico con proiezione Russell Circumplex), Gemini 2.5 Flash (LLM che analizza audio e trascrizione) e TRUST-Pathos (ensemble supervisore multi-agente LLM). Le correlazioni di Spearman mostrano che Gemini Valence è fortemente correlato con TRUST-Pathos (rho=+0,664, p<0,001), mentre emotion2vec Valence no (rho=+0,097, p=0,499). Il pipeline TRUST utilizza tre avvocati LLM per il punteggio del pathos. I risultati suggeriscono che gli LLM sono proxy più efficaci per il pathos retorico rispetto ai modelli acustici tradizionali.
Fatti principali
- Il paper arXiv 2605.22732 confronta il riconoscimento acustico delle emozioni e gli LLM per l'analisi del pathos nel discorso politico
- Il caso di studio utilizza un discorso al Bundestag di Felix Banaszak (51 segmenti, 245 secondi)
- Tre modalità testate: emotion2vec_plus_large, Gemini 2.5 Flash, TRUST-Pathos
- Gemini Valence è fortemente correlato con TRUST-Pathos (rho=+0,664, p<0,001)
- emotion2vec Valence non mostra correlazione significativa (rho=+0,097, p=0,499)
- TRUST-Pathos utilizza un ensemble supervisore a tre avvocati LLM
- Il modello SER acustico usa la proiezione post-hoc Russell Circumplex per Arousal e Valence
- L'analisi basata su LLM supera i modelli acustici per il rilevamento del pathos
Entità
Istituzioni
- arXiv
- Bundestag
- TRUST
Luoghi
- Germany