ARTFEED — Contemporary Art Intelligence

Nuova ricerca mette in discussione la catena del pensiero come meccanismo primario nel ragionamento dei LLM

ai-technology · 2026-04-20

Un recente position paper su arXiv sostiene che il processo di ragionamento nei grandi modelli linguistici dovrebbe essere visto principalmente come la formazione di traiettorie di stati latenti, piuttosto che come una catena del pensiero affidabile a livello superficiale. Gli autori identificano tre fattori interconnessi e propongono tre ipotesi concorrenti: H1 afferma che il ragionamento è guidato da traiettorie di stati latenti, H2 sostiene che si basa su catene di pensiero esplicite superficiali, e H0 sostiene che i miglioramenti osservati nel ragionamento possono essere attribuiti meglio al calcolo seriale generico invece che a qualsiasi oggetto rappresentazionale specializzato. Questa differenziazione è cruciale per le discussioni riguardanti fedeltà, interpretabilità, benchmark di ragionamento e interventi al momento dell'inferenza. Il documento reinterpreta studi empirici, meccanicistici e di indagine recenti all'interno di questo quadro, introducendo esempi verificati computazionalmente che scompongono tracce superficiali, interventi latenti e baseline comparabili. I risultati mettono in discussione le ipotesi fondamentali sulla valutazione delle capacità di ragionamento nei sistemi di IA.

Fatti principali

  • Il position paper sostiene che il ragionamento dei LLM dovrebbe essere studiato come formazione di traiettorie di stati latenti
  • Mette in discussione la catena del pensiero come oggetto primario del ragionamento
  • Formalizza tre ipotesi concorrenti sui meccanismi di ragionamento
  • Pubblicato su arXiv con identificatore 2604.15726v1
  • La distinzione influisce sulle affermazioni riguardanti fedeltà e interpretabilità
  • Impatta i benchmark di ragionamento e gli approcci di intervento al momento dell'inferenza
  • Riorganizza il recente lavoro empirico e meccanicistico sotto un nuovo quadro
  • Include esempi elaborati verificati computazionalmente

Entità

Istituzioni

  • arXiv

Fonti