I LLM Mostrano una Sistematica Miscalibrazione Epistemico-Retorica

ai-technology · 2026-04-24

Uno studio recente pubblicato su arXiv (2604.19768) presenta un quadro volto a misurare la separazione tra intensità retorica e fondamento epistemico nei modelli linguistici di grandi dimensioni. I ricercatori hanno sviluppato una tassonomia di marcatori epistemico-retorici triadici, operazionalizzati attraverso metriche composite: divergenza forma-significato, rapporto epistemico genuino vs. performato ed entropia della distribuzione dei dispositivi retorici. Esaminando 225 testi argomentativi (circa 0,6 milioni di token) provenienti da esperti umani, non esperti e fonti generate da LLM, hanno scoperto una firma epistemica coerente tra i modelli. I testi LLM utilizzano il tricolon quasi il doppio delle volte rispetto agli esperti (Δ=0,95), mentre gli autori umani usano l'erotema a un tasso più del doppio rispetto ai LLM. Inoltre, i marcatori di esitazione performata si trovano negli output LLM con una densità doppia rispetto ai testi umani, evidenziando una significativa divergenza forma-significato nei contenuti LLM.

Fatti principali

Studio da arXiv:2604.19768
Propone un quadro per quantificare la miscalibrazione epistemico-retorica
Tassonomia ERM triadica con metriche FMD, GPR, RDDE
Analizzati 225 testi argomentativi (~0,6M token)
Confrontati sottocorpora di esperti umani, non esperti umani e LLM
I LLM usano il tricolon quasi al doppio del tasso degli esperti (Δ=0,95)
Gli umani usano l'erotema a più del doppio del tasso dei LLM
Marcatori di esitazione performata due volte più densi negli output LLM

I LLM Mostrano una Sistematica Miscalibrazione Epistemico-Retorica

Fatti principali

Entità

Istituzioni

Fonti