Attribuzione probabilistica dei token per LLM
Un nuovo articolo di ricerca introduce una misura di attribuzione probabilistica dei token, agnostica rispetto al modello, per i Large Language Models (LLM). Il metodo utilizza la regola di Bayes per invertire le log-probabilità del token successivo, catturando la rappresentazione interna della distribuzione delle sequenze di token indipendentemente dalla sua struttura computazionale. Il punteggio di attribuzione è definito come il logaritmo del rapporto tra la probabilità condizionata della risposta dato il prompt e la probabilità con un token marginalizzato. Questo approccio colloca i LLM all'interno della teoria dei processi stocastici, offrendo un quadro per comprendere come i modelli generano risposte basate su probabilità apprese. L'articolo è disponibile su arXiv con identificatore 2605.21726.
Fatti principali
- 1. L'articolo è intitolato 'Probabilistic Attribution For Large Language Models'.
- 2. Propone una misura di attribuzione probabilistica dei token, agnostica rispetto al modello.
- 3. Il metodo utilizza la regola di Bayes per invertire le log-probabilità del token successivo.
- 4. Il punteggio di attribuzione è il logaritmo del rapporto tra due probabilità condizionate.
- 5. L'approccio è indipendente dalla struttura computazionale del modello.
- 6. Colloca i LLM all'interno della teoria matematica dei processi stocastici.
- 7. L'articolo è disponibile su arXiv con ID 2605.21726.
- 8. Il metodo cattura la rappresentazione interna della distribuzione delle sequenze di token del modello.
Entità
Istituzioni
- arXiv