BRANE: Ottimizzazione delle Query Basata su LLM per Agenti di Recupero
Un nuovo articolo su arXiv (2605.27361) introduce BRANE, un sistema che utilizza un LLM per convertire query in linguaggio naturale in caratteristiche specifiche del carico di lavoro, quindi addestra predittori leggeri per configurazione per stimare la correttezza della pipeline. Durante l'inferenza, BRANE seleziona la configurazione che massimizza la correttezza prevista penalizzata dal costo, consentendo un compromesso regolabile tra costo e qualità senza riaddestramento. L'approccio affronta l'ottimizzazione per query inesplorata negli agenti di recupero, che tipicamente si basano su pipeline ottimizzate manualmente. Valutato sui dataset MuSiQue e BrowseC, BRANE dimostra un miglioramento del bilancio accuratezza-costo.
Fatti principali
- L'articolo arXiv 2605.27361 introduce BRANE
- BRANE utilizza un LLM per convertire le query in caratteristiche specifiche del carico di lavoro
- Addestra predittori leggeri per configurazione per la stima della correttezza
- Seleziona la configurazione che massimizza la correttezza prevista penalizzata dal costo
- Consente un compromesso regolabile tra costo e qualità senza riaddestramento
- Valutato sui dataset MuSiQue e BrowseC
- Affronta il gap di ottimizzazione per query negli agenti di recupero
- Gli agenti di recupero moderni hanno molte scelte di configurazione (LLM, retriever, ecc.)
Entità
Istituzioni
- arXiv