Gli stimatori di incertezza non riescono a prevedere le allucinazioni dei LLM
Una recente indagine pubblicata su arXiv esamina a fondo come le tecniche di stima dell'incertezza siano correlate alle allucinazioni nei modelli linguistici di grandi dimensioni. Questo studio distingue tra allucinazioni intrinseche, che comportano violazioni della fedeltà dell'input, e allucinazioni estrinseche, caratterizzate da affermazioni non comprovate. Vari metodi di stima, tra cui quelli informativo-teorici, basati sul campionamento e riflessivi, sono stati valutati in molteplici contesti. I risultati mettono in discussione la convinzione diffusa che gli indicatori di incertezza segnalino costantemente carenze del modello.
Fatti principali
- Articolo arXiv 2605.27016
- Lo studio valuta gli stimatori di incertezza per la rilevazione di allucinazioni nei LLM
- Copre allucinazioni intrinseche ed estrinseche
- Testa stimatori informativo-teorici, basati sul campionamento e riflessivi
- Mette in discussione l'assunzione che le proxy di incertezza indichino un fallimento del modello
Entità
Istituzioni
- arXiv