BalanceRAG: Calibrazione Congiunta del Rischio per Sistemi di Retrieval-Augmented Generation a Cascata
arXiv:2605.20084v1 introduce BalanceRAG, un metodo per calibrare sistemi di retrieval-augmented generation (RAG) a cascata. Nel RAG a cascata, ogni query viene prima elaborata da un ramo solo LLM; se incerto, viene passato a un fallback RAG, e si astiene se nessun ramo è affidabile. BalanceRAG calibra congiuntamente coppie di soglie per i rami solo LLM e RAG utilizzando test grafici sequenziali su un reticolo bidimensionale, consentendo una calibrazione delle soglie adattiva al rischio che controlla i tassi di errore a livello di sistema. Questo approccio affronta il conservatorismo della calibrazione fase per fase considerando l'incertezza congiunta. Il lavoro è pubblicato su arXiv con ID 2605.20084.
Fatti principali
- BalanceRAG è un metodo per la calibrazione congiunta del rischio in sistemi RAG a cascata.
- Il RAG a cascata utilizza prima un ramo solo LLM, poi un fallback RAG in caso di incertezza.
- BalanceRAG inquadra le coppie di soglie come punti operativi su un reticolo bidimensionale.
- Utilizza test grafici sequenziali per identificare punti operativi sicuri.
- Il metodo controlla i tassi di errore a livello di sistema tra i rami.
- Affronta il conservatorismo della calibrazione fase per fase.
- L'articolo è su arXiv con ID 2605.20084.
- L'approccio consente una calibrazione delle soglie adattiva al rischio.
Entità
Istituzioni
- arXiv