TPA: Nuovo Metodo Rileva le Allucinazioni degli LLM Attribuendo le Probabilità dei Token

ai-technology · 2026-04-24

I ricercatori hanno svelato una nuova tecnica chiamata TPA, o Attribuzione della Probabilità del Prossimo Token, progettata per individuare le allucinazioni nei sistemi di Generazione Aumentata da Recupero (RAG). A differenza dei metodi precedenti che trattavano le allucinazioni come un semplice conflitto tra conoscenza interna e dati recuperati, TPA identifica sette fonti distinte che contribuiscono a questo problema: query, contesto RAG, token passato, token stesso, reti feedforward, LayerNorm finale e embedding iniziale. Collegando matematicamente la probabilità di ogni token a queste fonti, TPA valuta il loro ruolo nel processo di generazione. L'analisi dei punteggi di attribuzione utilizzando i tag Part-of-Speech evidenzia come diversi componenti del modello influenzino le allucinazioni. Puoi consultare l'articolo completo su arXiv con il riferimento 2512.07515.

Fatti principali

1. TPA attribuisce la probabilità dei token a sette fonti: query, contesto RAG, token passato, token stesso, FFN, LayerNorm finale, embedding iniziale.
2. I metodi precedenti consideravano solo il conflitto binario tra FFN e contesto recuperato.
3. L'aggregazione tramite tag Part-of-Speech quantifica i contributi dei componenti.
4. Articolo disponibile su arXiv con ID 2512.07515.
5. Pubblicato come arXiv:2512.07515v4 (replace-cross).

TPA: Nuovo Metodo Rileva le Allucinazioni degli LLM Attribuendo le Probabilità dei Token

Fatti principali

Entità

Istituzioni

Fonti