Attribuzione probabilistica dei token per LLM

ai-technology · 2026-05-23

Un nuovo articolo di ricerca introduce una misura di attribuzione probabilistica dei token, agnostica rispetto al modello, per i Large Language Models (LLM). Il metodo utilizza la regola di Bayes per invertire le log-probabilità del token successivo, catturando la rappresentazione interna della distribuzione delle sequenze di token indipendentemente dalla sua struttura computazionale. Il punteggio di attribuzione è definito come il logaritmo del rapporto tra la probabilità condizionata della risposta dato il prompt e la probabilità con un token marginalizzato. Questo approccio colloca i LLM all'interno della teoria dei processi stocastici, offrendo un quadro per comprendere come i modelli generano risposte basate su probabilità apprese. L'articolo è disponibile su arXiv con identificatore 2605.21726.

Fatti principali

1. L'articolo è intitolato 'Probabilistic Attribution For Large Language Models'.
2. Propone una misura di attribuzione probabilistica dei token, agnostica rispetto al modello.
3. Il metodo utilizza la regola di Bayes per invertire le log-probabilità del token successivo.
4. Il punteggio di attribuzione è il logaritmo del rapporto tra due probabilità condizionate.
5. L'approccio è indipendente dalla struttura computazionale del modello.
6. Colloca i LLM all'interno della teoria matematica dei processi stocastici.
7. L'articolo è disponibile su arXiv con ID 2605.21726.
8. Il metodo cattura la rappresentazione interna della distribuzione delle sequenze di token del modello.

Attribuzione probabilistica dei token per LLM

Fatti principali

Entità

Istituzioni

Fonti