Il framework ARQ migliora il ragionamento dei LLM con pietre miliari generate
Un nuovo framework chiamato ARQ (Asking the Right Questions) migliora il ragionamento dei grandi modelli linguistici generando pietre miliari intermedie come semplificazioni, riformulazioni alternative o sottoproblemi. La ricerca mostra che queste domande sono trasferibili e aiutano significativamente LLM di diverse capacità a risolvere compiti complessi come matematica e programmazione. L'approccio inquadra la generazione di pietre miliari come un compito di post-addestramento, dimostrando che buone domande possono essere prodotte sistematicamente per migliorare le prestazioni di ragionamento.
Fatti principali
- ARQ introduce un generatore di domande nel flusso di ragionamento predefinito.
- Le pietre miliari includono semplificazioni, riformulazioni alternative o sottoproblemi.
- Buone domande pietra miliare sono trasferibili tra LLM.
- Il framework migliora il ragionamento in compiti di matematica e programmazione.
- La generazione di pietre miliari è inquadrata come un compito di post-addestramento.
- La ricerca è pubblicata su arXiv con ID 2602.19069.
Entità
Istituzioni
- arXiv