Segnali di Ragionamento Strutturato, Non Codice, Migliorano il Ragionamento Matematico nei Modelli Linguistici
Uno studio recente pubblicato su arXiv mette in discussione la convinzione che l'incorporazione del codice migliori il ragionamento generale nei modelli linguistici. I ricercatori hanno condotto un pre-addestramento controllato utilizzando un dataset di 10 trilioni di token con una netta separazione dei domini e hanno scoperto che il codice eseguibile non migliora le capacità di ragionamento; piuttosto, compete con compiti ad alta intensità di conoscenza, inclusa la matematica avanzata. I miglioramenti nel ragionamento tipicamente attribuiti al codice derivano dal ragionamento strutturato attraverso diversi domini, come combinazioni di codice e testo o matematica e testo. Aumentando la proporzione di esempi strutturati di dominio matematico all'interno di un budget matematico fisso, sono stati osservati miglioramenti significativi in compiti di ragionamento matematico impegnativi.
Fatti principali
- Studio su arXiv (2605.19762) riconsidera l'affermazione che il codice migliori il ragionamento.
- Esperimenti di pre-addestramento controllato su un corpus di 10T token con separazione fine dei domini.
- Il codice limitato a programmi eseguibili autonomi non funge da potenziatore generale del ragionamento.
- Il codice compete con compiti ad alta intensità di conoscenza, specialmente il ragionamento matematico complesso.
- I guadagni nel ragionamento attribuiti al codice sono meglio spiegati da tracce di ragionamento strutturato cross-dominio (miscugli codice-testo, matematica-testo).
- Aumentare la densità di campioni strutturati di dominio matematico all'interno di un budget matematico fisso produce guadagni sostanziali nel ragionamento matematico difficile.
Entità
Istituzioni
- arXiv