RealRoute: Sistema Recupera-poi-Verifica per il Routing di Query RAG
I ricercatori hanno introdotto RealRoute, un framework che sposta il routing delle query nella Retrieval-Augmented Generation (RAG) da un paradigma predittivo a uno di recupero e verifica. I metodi tradizionali LLM-as-a-Router inviano sotto-query a fonti specifiche basandosi sul significato semantico, ma spesso falliscono quando i confini delle fonti sono ambigui. RealRoute esegue un recupero parallelo e indipendente dalla fonte per garantire la completezza delle prove, quindi utilizza un verificatore dinamico per incrociare i risultati e sintetizzare risposte fattualmente fondate. Il sistema è progettato per gestire fonti eterogenee come database privati, corpora globali e API. Una dimostrazione consente agli utenti di visualizzare il routing e la verifica in tempo reale. Il lavoro è pubblicato su arXiv (2604.20860).
Fatti principali
- RealRoute utilizza un paradigma recupera-poi-verifica invece del routing predittivo.
- Esegue un recupero parallelo e indipendente dalla fonte per la completezza delle prove.
- Un verificatore dinamico incrocia i risultati e sintetizza le risposte.
- Progettato per fonti eterogenee: database privati, corpora globali, API.
- I metodi tradizionali LLM-as-a-Router falliscono quando i confini delle fonti sono ambigui.
- La dimostrazione consente la visualizzazione in tempo reale del routing e della verifica.
- Pubblicato su arXiv con ID 2604.20860.
- Il lavoro affronta le sfide nell'applicazione della RAG su più fonti di dati.
Entità
Istituzioni
- arXiv