SPARK: Auto-Gioco con Ricompensa Asimmetrica da Grafi di Conoscenza
Un nuovo framework chiamato SPARK (Self-Play with Asymmetric Reward from Knowledge Graphs) mira a estendere l'apprendimento per rinforzo basato sull'auto-gioco alla letteratura scientifica. L'auto-gioco ha avuto successo in domini come la matematica e la programmazione, dove la generazione di problemi e il calcolo delle ricompense si basano su regole esplicite. Tuttavia, la letteratura scientifica presenta sfide perché le relazioni tra elementi multimodali attraverso i documenti sono raramente esplicite, rendendo difficile la generazione automatica di domande e l'ottenimento di segnali di ricompensa affidabili. SPARK affronta questo problema costruendo automaticamente un grafo di conoscenza unificato da documenti scientifici multipli. Il grafo di conoscenza funge da base strutturale per l'auto-gioco: i percorsi attraverso nodi multimodali generano domande di ragionamento relazionale, e i fatti strutturati nel grafo forniscono un calcolo verificabile delle ricompense. L'articolo è pubblicato su arXiv con ID 2605.05546.
Fatti principali
- SPARK sta per Self-Play with Asymmetric Reward from Knowledge Graphs.
- È un framework per l'apprendimento per rinforzo basato sull'auto-gioco nella letteratura scientifica.
- L'auto-gioco ha mostrato ottime prestazioni in matematica e programmazione.
- La letteratura scientifica manca di relazioni esplicite tra elementi multimodali.
- SPARK costruisce automaticamente un grafo di conoscenza unificato da documenti scientifici multipli.
- I percorsi nel grafo di conoscenza generano domande di ragionamento relazionale.
- I fatti strutturati nel grafo di conoscenza forniscono un calcolo verificabile delle ricompense.
- L'articolo è su arXiv con ID 2605.05546.
Entità
Istituzioni
- arXiv