Il Prompting Diverge-to-Induce Migliora il Ragionamento Zero-Shot nei LLM
Un nuovo framework chiamato Diverge-to-Induce Prompting (DIP) migliora il ragionamento zero-shot nei grandi modelli linguistici generando molteplici ragionamenti diversi prima di sintetizzare un piano finale. A differenza del prompting standard Chain-of-Thought, che si basa su un unico percorso di ragionamento, DIP prima induce il LLM a produrre diverse ragioni di alto livello, elabora ciascuna in un piano dettagliato, e poi le induce in un piano finale. Gli esperimenti mostrano che DIP supera i metodi a strategia singola senza un campionamento dispendioso in termini di risorse. Il lavoro affronta l'instabilità nei percorsi di ragionamento non guidati e dimostra l'efficacia dell'induzione multi-piano.
Fatti principali
- DIP sta per Diverge-to-Induce Prompting.
- Genera molteplici ragionamenti diversi di alto livello per ogni domanda.
- Ogni ragionamento viene elaborato in un piano dettagliato passo-passo.
- I piani bozza vengono indotti in un piano finale.
- DIP migliora l'accuratezza del ragionamento zero-shot.
- Non si basa su un campionamento dispendioso in termini di risorse.
- Gli esperimenti mostrano che DIP supera il prompting a strategia singola.
- Il metodo affronta l'instabilità del prompting standard Chain-of-Thought.
Entità
Istituzioni
- arXiv