Controllo del Budget per Agenti di Ricerca LLM tramite Valore dell'Informazione
Un recente preprint su arXiv (2605.05701) presenta una tecnica innovativa per gestire i budget di inferenza in agenti di ricerca che utilizzano LLM. Questo metodo affronta il problema dei vincoli simultanei sull'uso degli strumenti e sulla generazione di token. Gli autori concettualizzano il question answering multi-hop come una sfida di gestione del budget in due fasi. Durante la fase di ricerca, un controller valuta ogni azione possibile assegnando un punteggio di Valore dell'Informazione (VOI), che stima il valore aggiuntivo del task per unità di budget in base allo stato corrente e al doppio budget rimanente. Questo sistema di punteggio informa le scelte riguardanti il recupero, la scomposizione e l'impegno di risposta. Dopo la ricerca, un finalizzatore selettivo basato su prove valuta la risposta della traiettoria rispetto a un candidato raffinato. L'obiettivo è migliorare la qualità della risposta sotto limiti rigorosi senza la necessità di modelli più avanzati.
Fatti principali
- arXiv:2605.05701
- Gli agenti di ricerca LLM affrontano budget doppi: chiamate agli strumenti e token generati
- Proposto un controllo del budget di inferenza in due fasi
- Il controller utilizza punteggi di Valore dell'Informazione (VOI)
- Il VOI stima il valore marginale del task per unità di budget
- Le azioni includono recupero, scomposizione e impegno di risposta
- Finalizzatore selettivo basato su prove confronta la risposta della traiettoria con un candidato raffinato
- Focus sul question answering multi-hop
Entità
Istituzioni
- arXiv