Controllo del Budget per Agenti di Ricerca LLM tramite Valore dell'Informazione

ai-technology · 2026-05-09

Un recente preprint su arXiv (2605.05701) presenta una tecnica innovativa per gestire i budget di inferenza in agenti di ricerca che utilizzano LLM. Questo metodo affronta il problema dei vincoli simultanei sull'uso degli strumenti e sulla generazione di token. Gli autori concettualizzano il question answering multi-hop come una sfida di gestione del budget in due fasi. Durante la fase di ricerca, un controller valuta ogni azione possibile assegnando un punteggio di Valore dell'Informazione (VOI), che stima il valore aggiuntivo del task per unità di budget in base allo stato corrente e al doppio budget rimanente. Questo sistema di punteggio informa le scelte riguardanti il recupero, la scomposizione e l'impegno di risposta. Dopo la ricerca, un finalizzatore selettivo basato su prove valuta la risposta della traiettoria rispetto a un candidato raffinato. L'obiettivo è migliorare la qualità della risposta sotto limiti rigorosi senza la necessità di modelli più avanzati.

Fatti principali

arXiv:2605.05701
Gli agenti di ricerca LLM affrontano budget doppi: chiamate agli strumenti e token generati
Proposto un controllo del budget di inferenza in due fasi
Il controller utilizza punteggi di Valore dell'Informazione (VOI)
Il VOI stima il valore marginale del task per unità di budget
Le azioni includono recupero, scomposizione e impegno di risposta
Finalizzatore selettivo basato su prove confronta la risposta della traiettoria con un candidato raffinato
Focus sul question answering multi-hop

Controllo del Budget per Agenti di Ricerca LLM tramite Valore dell'Informazione

Fatti principali

Entità

Istituzioni

Fonti