Quadro Unificato per la Memoria in Agenti LLM Multi-Traiettoria che Utilizzano Strumenti
Un recente preprint su arXiv (2605.28224) introduce un quadro completo per la gestione della memoria nell'inferenza multi-traiettoria per agenti LLM che utilizzano strumenti. Questo quadro categorizza la memoria in due dimensioni: l'ambito del trasferimento (se all'interno di un'espansione o tra traiettorie) e il livello di astrazione delle informazioni trasferite. Valuta quattro tecniche di memoria utilizzando tre approcci di inferenza (best-of-N, beam search, MCTS) su quattro benchmark relativi all'uso di strumenti, tra cui SQL, grafi di conoscenza e ambienti CLI, tutti in un contesto senza verificatore. La ricerca cerca di determinare se i miglioramenti osservati siano dovuti alle caratteristiche dell'astrazione della memoria o al metodo di inferenza, poiché le tecniche attuali sono state testate solo con strategie di inferenza singole su compiti individuali.
Fatti principali
- arXiv:2605.28224
- Inferenza multi-traiettoria per agenti LLM che utilizzano strumenti
- Memoria scomposta lungo ambito di trasferimento e astrazione
- Quattro metodi di memoria valutati
- Tre strategie di inferenza: best-of-N, beam search, MCTS
- Quattro benchmark per l'uso di strumenti: SQL, grafo di conoscenza, CLI
- Ambiente senza verificatore
- Obiettivo: separare l'astrazione della memoria dal metodo di inferenza
Entità
Istituzioni
- arXiv