Evolving-RL: Ottimizzazione Congiunta di Agenti Auto-Evolventi Guidati dall'Esperienza
I ricercatori propongono Evolving-RL, un framework che ottimizza congiuntamente l'estrazione e l'utilizzo dell'esperienza in agenti basati su modelli linguistici di grandi dimensioni. I sistemi auto-evolventi esistenti si concentrano sulla progettazione a livello di sistema, trascurando le capacità del modello. Evolving-RL tratta l'auto-evoluzione come un processo unificato, utilizzando l'apprendimento per rinforzo per migliorare sia l'astrazione che l'apprendimento contestuale. L'approccio si concentra sull'ottimizzazione end-to-end della capacità dell'agente di adattarsi dalle interazioni passate. L'articolo è disponibile su arXiv con ID 2605.10663.
Fatti principali
- Evolving-RL è un framework algoritmico per agenti auto-evolventi
- Ottimizza congiuntamente l'estrazione e l'utilizzo dell'esperienza
- Gli studi esistenti si concentrano sulla progettazione a livello di sistema, non sulle capacità del modello
- Il framework utilizza l'apprendimento per rinforzo per l'ottimizzazione
- Mira a migliorare astrazione, generalizzazione e apprendimento contestuale
- L'articolo è pubblicato su arXiv con ID 2605.10663
- Gli agenti auto-evolventi superano la natura statica dei LLM distillando l'esperienza
- L'approccio tratta l'auto-evoluzione come un processo unificato
Entità
Istituzioni
- arXiv