ARTFEED — Contemporary Art Intelligence

Stati Nascosti Rivelano Informazioni Rilevanti per il Compito nel Ragionamento a Catena di Pensiero

ai-technology · 2026-04-29

Un recente articolo di ricerca su arXiv (2604.23351) esamina se i token della catena di pensiero (CoT) contengono informazioni specifiche del compito al di là di semplici spiegazioni. Utilizzando il patching dell'attivazione su GSM8K, i ricercatori hanno trasferito gli stati nascosti a livello di token da una generazione CoT a una risposta diretta per la stessa domanda. I risultati indicano che il patching raggiunge una maggiore accuratezza sia rispetto al prompting a risposta diretta sia alla traccia CoT originale, suggerendo che i singoli token CoT possiedono informazioni sufficienti per derivare la risposta corretta, anche se la traccia originale è imperfetta. Le informazioni rilevanti per il compito sono più abbondanti nelle esecuzioni CoT corrette, distribuite in modo non uniforme tra i token, con una concentrazione negli strati medio-alti e che appaiono prima nel processo di ragionamento. Lo studio esamina anche i token linguistici, inclusi i verbi.

Fatti principali

  • Lo studio utilizza il patching dell'attivazione su GSM8K
  • Stati nascosti a livello di token trasferiti da CoT a esecuzione a risposta diretta
  • Il patching produce una maggiore accuratezza rispetto al prompting a risposta diretta e alla traccia CoT originale
  • Le informazioni rilevanti per il compito sono più prevalenti nelle esecuzioni CoT corrette
  • Le informazioni si concentrano negli strati medio-alti
  • Le informazioni appaiono prima nella traccia di ragionamento
  • Token linguistici come i verbi vengono patchati
  • Pubblicato su arXiv con ID 2604.23351

Entità

Istituzioni

  • arXiv

Fonti