Apprendimento Evolutivo degli Agenti: Un Framework a Due Scale Temporali per Agenti LLM in Ambienti Aperti
Un nuovo framework chiamato Apprendimento Evolutivo degli Agenti (AEL) è stato sviluppato dai ricercatori per facilitare l'apprendimento degli agenti LLM dalle loro esperienze attraverso numerosi episodi sequenziali in contesti aperti. Questo framework affronta la sfida non solo di determinare quali informazioni conservare, ma anche come utilizzarle efficacemente, inclusa la selezione delle politiche di recupero, l'interpretazione dei risultati passati e gli aggiustamenti strategici. Su una scala temporale rapida, un bandit di Thompson Sampling identifica la politica di recupero della memoria appropriata per ogni episodio. Nel frattempo, su una scala temporale più lenta, una riflessione guidata da LLM analizza i modelli di fallimento e integra intuizioni causali nel processo decisionale dell'agente. Il framework è stato valutato utilizzando un benchmark sequenziale di portafoglio con 10 ticker diversi su 208 episodi, e i risultati sono stati pubblicati su arXiv con il numero di articolo 2604.21725.
Fatti principali
- AEL è un framework a due scale temporali per agenti LLM.
- La scala temporale rapida utilizza un bandit di Thompson Sampling per la politica di recupero della memoria.
- La scala temporale lenta utilizza la riflessione guidata da LLM per intuizioni causali.
- Testato su un benchmark sequenziale di portafoglio con 10 ticker su 208 episodi.
- Pubblicato su arXiv con ID 2604.21725.
- Affronta come utilizzare le informazioni ricordate, non solo cosa ricordare.
- Il framework consente agli agenti di convertire l'esperienza passata in un comportamento futuro migliore.
- AEL sta per Apprendimento Evolutivo degli Agenti.
Entità
Istituzioni
- arXiv