KG-R1: L'apprendimento per rinforzo ottimizza il RAG su grafi di conoscenza per LLM

ai-technology · 2026-05-25

I ricercatori introducono KG-R1, un framework agentico che utilizza l'apprendimento per rinforzo per ottimizzare la generazione aumentata da recupero su grafi di conoscenza (KG-RAG) per modelli linguistici di grandi dimensioni. A differenza dei sistemi KG-RAG tradizionali che si basano su pipeline fisse di più moduli LLM (pianificazione, ragionamento, risposta), KG-R1 impiega un singolo agente che interagisce con i grafi di conoscenza come proprio ambiente, imparando a recuperare informazioni passo dopo passo e integrandole nel ragionamento e nella generazione. Questo processo unificato riduce i costi di inferenza e migliora la trasferibilità tra diversi schemi di grafo. Valutato su benchmark di Question Answering su grafi di conoscenza (KGQA), KG-R1 che utilizza Qwen 2.5-3B raggiunge una maggiore accuratezza delle risposte con meno token di generazione rispetto ai metodi esistenti. Il lavoro affronta limiti chiave degli attuali sistemi KG-RAG, inclusi gli alti costi di inferenza e le prestazioni specifiche dello schema. L'articolo è disponibile su arXiv con riferimento 2509.26383.

Fatti principali

KG-R1 è un framework agentico per KG-RAG che utilizza l'apprendimento per rinforzo.
Utilizza un singolo agente invece di più moduli LLM.
L'agente interagisce con i KG come proprio ambiente.
Impara a recuperare informazioni passo dopo passo.
Integra recupero, ragionamento e generazione in un processo unificato.
Valutato su benchmark KGQA.
Utilizza il modello Qwen 2.5-3B.
Migliora l'accuratezza delle risposte con meno token di generazione.
Affronta gli alti costi di inferenza e le prestazioni specifiche dello schema.
Articolo disponibile su arXiv: 2509.26383.

KG-R1: L'apprendimento per rinforzo ottimizza il RAG su grafi di conoscenza per LLM

Fatti principali

Entità

Istituzioni

Fonti