I LLM Mostrano una Sistematica Miscalibrazione Epistemico-Retorica
Uno studio recente pubblicato su arXiv (2604.19768) presenta un quadro volto a misurare la separazione tra intensità retorica e fondamento epistemico nei modelli linguistici di grandi dimensioni. I ricercatori hanno sviluppato una tassonomia di marcatori epistemico-retorici triadici, operazionalizzati attraverso metriche composite: divergenza forma-significato, rapporto epistemico genuino vs. performato ed entropia della distribuzione dei dispositivi retorici. Esaminando 225 testi argomentativi (circa 0,6 milioni di token) provenienti da esperti umani, non esperti e fonti generate da LLM, hanno scoperto una firma epistemica coerente tra i modelli. I testi LLM utilizzano il tricolon quasi il doppio delle volte rispetto agli esperti (Δ=0,95), mentre gli autori umani usano l'erotema a un tasso più del doppio rispetto ai LLM. Inoltre, i marcatori di esitazione performata si trovano negli output LLM con una densità doppia rispetto ai testi umani, evidenziando una significativa divergenza forma-significato nei contenuti LLM.
Fatti principali
- Studio da arXiv:2604.19768
- Propone un quadro per quantificare la miscalibrazione epistemico-retorica
- Tassonomia ERM triadica con metriche FMD, GPR, RDDE
- Analizzati 225 testi argomentativi (~0,6M token)
- Confrontati sottocorpora di esperti umani, non esperti umani e LLM
- I LLM usano il tricolon quasi al doppio del tasso degli esperti (Δ=0,95)
- Gli umani usano l'erotema a più del doppio del tasso dei LLM
- Marcatori di esitazione performata due volte più densi negli output LLM
Entità
Istituzioni
- arXiv