Recuperare Tracce di Ragionamento Potenzia l'AI nel Ragionamento
Un recente preprint su arXiv contesta l'idea che il retrieval-augmented generation (RAG) abbia utilità limitata per compiti che richiedono un ragionamento esteso, come la matematica e la generazione di codice. I ricercatori sostengono che il problema non sia il RAG in sé, ma piuttosto il corpus selezionato. Suggeriscono che invece di recuperare documenti, si dovrebbero ottenere tracce di ragionamento—percorsi di ragionamento intermedi creati durante la risoluzione di problemi. Presentano T3, una tecnica offline che converte queste tracce in formati strutturati adatti al recupero. Utilizzando questo nuovo corpus, un approccio diretto di retrieve-then-generate migliora costantemente le capacità di ragionamento su modelli robusti e benchmark, tra cui AIME 2025–2026, LiveCodeBench e GPQA-Diamond, superando sia le baseline non RAG che il recupero standard di documenti.
Fatti principali
- Si ritiene ampiamente che il RAG offra benefici limitati per problemi che richiedono ragionamento.
- L'articolo propone di recuperare tracce di ragionamento invece di documenti.
- T3 trasforma le tracce di ragionamento in rappresentazioni strutturate e adatte al recupero.
- Il metodo migliora le prestazioni di ragionamento su AIME 2025–2026, LiveCodeBench e GPQA-Diamond.
- L'approccio supera le baseline non RAG e il recupero su documenti standard.
- Il preprint è disponibile su arXiv con ID 2605.03344.
- Il metodo funziona con modelli potenti e molteplici benchmark.
- Gli autori sfidano l'assunzione che il RAG sia inefficace per compiti di ragionamento.
Entità
Istituzioni
- arXiv