Stati Nascosti Rivelano Informazioni Rilevanti per il Compito nel Ragionamento a Catena di Pensiero
Un recente articolo di ricerca su arXiv (2604.23351) esamina se i token della catena di pensiero (CoT) contengono informazioni specifiche del compito al di là di semplici spiegazioni. Utilizzando il patching dell'attivazione su GSM8K, i ricercatori hanno trasferito gli stati nascosti a livello di token da una generazione CoT a una risposta diretta per la stessa domanda. I risultati indicano che il patching raggiunge una maggiore accuratezza sia rispetto al prompting a risposta diretta sia alla traccia CoT originale, suggerendo che i singoli token CoT possiedono informazioni sufficienti per derivare la risposta corretta, anche se la traccia originale è imperfetta. Le informazioni rilevanti per il compito sono più abbondanti nelle esecuzioni CoT corrette, distribuite in modo non uniforme tra i token, con una concentrazione negli strati medio-alti e che appaiono prima nel processo di ragionamento. Lo studio esamina anche i token linguistici, inclusi i verbi.
Fatti principali
- Lo studio utilizza il patching dell'attivazione su GSM8K
- Stati nascosti a livello di token trasferiti da CoT a esecuzione a risposta diretta
- Il patching produce una maggiore accuratezza rispetto al prompting a risposta diretta e alla traccia CoT originale
- Le informazioni rilevanti per il compito sono più prevalenti nelle esecuzioni CoT corrette
- Le informazioni si concentrano negli strati medio-alti
- Le informazioni appaiono prima nella traccia di ragionamento
- Token linguistici come i verbi vengono patchati
- Pubblicato su arXiv con ID 2604.23351
Entità
Istituzioni
- arXiv