Il Framework GraphRAG-Router Utilizza il Reinforcement Learning per Risposte AI Efficaci in Termini di Costi
Un nuovo framework chiamato GraphRAG-Router affronta le inefficienze dei sistemi GraphRAG esistenti per il question answering ad alta intensità di conoscenza. Gli approcci tradizionali si basano su framework di recupero fissi e su singoli, spesso costosi, grandi modelli linguistici per tutte le query, indipendentemente dalla complessità. Questo design statico limita l'adattabilità e comporta costi computazionali non necessari. GraphRAG-Router introduce una strategia di routing gerarchico per coordinare più GraphRAG eterogenei e LLM generatori. Il sistema viene inizialmente preparato attraverso un fine-tuning supervisionato prima di sottoporsi a un'ottimizzazione tramite una procedura di reinforcement learning a due fasi. La seconda fase di questa procedura incorpora un meccanismo di ricompensa consapevole dei costi basato su curriculum. L'obiettivo è abbinare dinamicamente la complessità della query con risorse computazionali appropriate, migliorando sia l'efficienza che le prestazioni. La ricerca è stata annunciata su arXiv con l'identificatore 2604.16401v1, classificata come cross-announcement. La generazione aumentata dal recupero basata su grafi è recentemente diventata un paradigma significativo, in particolare per compiti che richiedono l'organizzazione strutturata delle evidenze e il ragionamento multi-hop.
Fatti principali
- Il framework si chiama GraphRAG-Router.
- Mira a migliorare l'efficienza in termini di costi nel question answering ad alta intensità di conoscenza.
- Utilizza una strategia di routing gerarchico per coordinare più GraphRAG e LLM.
- L'ottimizzazione coinvolge una procedura di reinforcement learning a due fasi.
- La seconda fase del RL introduce una ricompensa consapevole dei costi basata su curriculum.
- Il sistema viene prima preparato tramite fine-tuning supervisionato.
- La ricerca è stata annunciata su arXiv con l'ID 2604.16401v1.
- GraphRAG è noto per consentire l'organizzazione strutturata delle evidenze e il ragionamento multi-hop.
Entità
Istituzioni
- arXiv