Stati Nascosti Rivelano Informazioni Rilevanti per il Compito nel Ragionamento a Catena di Pensiero

ai-technology · 2026-04-29

Un recente articolo di ricerca su arXiv (2604.23351) esamina se i token della catena di pensiero (CoT) contengono informazioni specifiche del compito al di là di semplici spiegazioni. Utilizzando il patching dell'attivazione su GSM8K, i ricercatori hanno trasferito gli stati nascosti a livello di token da una generazione CoT a una risposta diretta per la stessa domanda. I risultati indicano che il patching raggiunge una maggiore accuratezza sia rispetto al prompting a risposta diretta sia alla traccia CoT originale, suggerendo che i singoli token CoT possiedono informazioni sufficienti per derivare la risposta corretta, anche se la traccia originale è imperfetta. Le informazioni rilevanti per il compito sono più abbondanti nelle esecuzioni CoT corrette, distribuite in modo non uniforme tra i token, con una concentrazione negli strati medio-alti e che appaiono prima nel processo di ragionamento. Lo studio esamina anche i token linguistici, inclusi i verbi.

Fatti principali

Lo studio utilizza il patching dell'attivazione su GSM8K
Stati nascosti a livello di token trasferiti da CoT a esecuzione a risposta diretta
Il patching produce una maggiore accuratezza rispetto al prompting a risposta diretta e alla traccia CoT originale
Le informazioni rilevanti per il compito sono più prevalenti nelle esecuzioni CoT corrette
Le informazioni si concentrano negli strati medio-alti
Le informazioni appaiono prima nella traccia di ragionamento
Token linguistici come i verbi vengono patchati
Pubblicato su arXiv con ID 2604.23351

Stati Nascosti Rivelano Informazioni Rilevanti per il Compito nel Ragionamento a Catena di Pensiero

Fatti principali

Entità

Istituzioni

Fonti