La Gestione Adattiva del Contesto Migliora le Performance degli Agenti LLM
I ricercatori introducono AdaCoM, un sistema che addestra un LLM esterno a gestire il contesto per agenti congelati tramite apprendimento per rinforzo, migliorando le performance in compiti a lungo termine come la ricerca web e la ricerca approfondita. AdaCoM pota i contenuti obsoleti preservando i vincoli del compito, rivelando un compromesso tra Fedeltà e Affidabilità.
Fatti principali
- AdaCoM addestra un LLM esterno a gestire il contesto di un agente congelato.
- Utilizza azioni di modifica flessibili e apprendimento per rinforzo end-to-end.
- Testato su benchmark di ricerca web e ricerca approfondita.
- Migliora le performance preservando i vincoli del compito e lo stato di avanzamento.
- Pota i contenuti obsoleti per evitare il degrado del contesto lungo.
- Rivela un compromesso tra Fedeltà e Affidabilità.
- I metodi precedenti richiedono l'addestramento dell'agente stesso, poco pratico per agenti closed-source.
- Agenti diversi possono richiedere strategie di gestione del contesto differenti.
Entità
Istituzioni
- arXiv