I Percorsi dei Grafi di Conoscenza Migliorano gli Agenti di Ricerca Auto-Evolventi

ai-technology · 2026-05-09

I ricercatori propongono l'uso di percorsi di grafi di conoscenza come supervisione intermedia per migliorare gli agenti di ricerca auto-evolventi. L'approccio affronta due colli di bottiglia nel framework Search Self-Play (SSP): la generazione di domande non valide da parte del Proposer e i segnali di ricompensa sparsi per il Solver. Ancorando la costruzione delle domande a sottografi di grafi di conoscenza guidati da LLM, il metodo fornisce un contesto relazionale, migliorando la validità delle domande. Inoltre, i percorsi dei grafi di conoscenza offrono un feedback più ricco rispetto alle ricompense binarie, aiutando il Solver ad apprendere da traiettorie parzialmente corrette. Il lavoro è pubblicato su arXiv con ID 2605.05702.

Fatti principali

ID del paper arXiv: 2605.05702
Tipo di annuncio: nuovo
Si basa sul framework Search Self-Play (SSP)
Affronta due colli di bottiglia in SSP: domande non valide e ricompense sparse
Utilizza percorsi di grafi di conoscenza come supervisione intermedia
Ancora la costruzione delle domande a sottografi di grafi di conoscenza guidati da LLM
Fornisce un contesto relazionale per il Proposer
Offre un feedback più ricco rispetto alle ricompense binarie sui risultati

I Percorsi dei Grafi di Conoscenza Migliorano gli Agenti di Ricerca Auto-Evolventi

Fatti principali

Entità

Istituzioni

Fonti