I Momenti 'Aha' degli LLM Spiegati dalla Verbalizzazione Strategica dell'Incertezza
Uno studio recente pubblicato su arXiv (2603.15500) indica che i modelli linguistici di grandi dimensioni (LLM) mostrano tendenze all'autocorrezione, spesso segnalate da espressioni come 'Aspetta.' Questo comportamento non è attribuito a un notevole processo interno, ma piuttosto all'espressione intenzionale di incertezza. I ricercatori introducono un quadro informativo-teorico che distingue tra progresso procedurale ed espressione epistemica, illustrando che occasionali espressioni di dubbio possono aiutare a riallinearsi verso risposte accurate, anche in assenza di chiari segnali di errore. I loro risultati suggeriscono che un semplice segnale di dubbio può reindirizzare percorsi falliti, e un piccolo fine-tuning supervisionato è sufficiente per potenziare o diminuire questa capacità. In definitiva, un ragionamento efficace si basa più sulla verbalizzazione dell'incertezza che su un distinto meccanismo interno.
Fatti principali
- Lo studio proviene dal preprint arXiv 2603.15500.
- Gli LLM mostrano spesso 'momenti Aha' come l'autocorrezione dopo 'Aspetta'.
- Gli LLM standard collassano attraverso divergenza silenziosa senza espliciti trigger di errore.
- Il quadro separa il ragionamento in avanzamento procedurale e verbalizzazione epistemica.
- La verbalizzazione sporadica ripristina la convergenza verso risposte corrette.
- Un minimo segnale di dubbio recupera empiricamente traiettorie fallite.
- Un piccolo SFT può instillare o sopprimere questa capacità.
- Un ragionamento forte è legato all'abitudine linguistica di esternalizzare l'incertezza.
Entità
Istituzioni
- arXiv