I Percorsi dei Grafi di Conoscenza Migliorano gli Agenti di Ricerca Auto-Evolventi
I ricercatori propongono l'uso di percorsi di grafi di conoscenza come supervisione intermedia per migliorare gli agenti di ricerca auto-evolventi. L'approccio affronta due colli di bottiglia nel framework Search Self-Play (SSP): la generazione di domande non valide da parte del Proposer e i segnali di ricompensa sparsi per il Solver. Ancorando la costruzione delle domande a sottografi di grafi di conoscenza guidati da LLM, il metodo fornisce un contesto relazionale, migliorando la validità delle domande. Inoltre, i percorsi dei grafi di conoscenza offrono un feedback più ricco rispetto alle ricompense binarie, aiutando il Solver ad apprendere da traiettorie parzialmente corrette. Il lavoro è pubblicato su arXiv con ID 2605.05702.
Fatti principali
- ID del paper arXiv: 2605.05702
- Tipo di annuncio: nuovo
- Si basa sul framework Search Self-Play (SSP)
- Affronta due colli di bottiglia in SSP: domande non valide e ricompense sparse
- Utilizza percorsi di grafi di conoscenza come supervisione intermedia
- Ancora la costruzione delle domande a sottografi di grafi di conoscenza guidati da LLM
- Fornisce un contesto relazionale per il Proposer
- Offre un feedback più ricco rispetto alle ricompense binarie sui risultati
Entità
Istituzioni
- arXiv