Evolving-RL: Ottimizzazione Congiunta di Agenti Auto-Evolventi Guidati dall'Esperienza

publication · 2026-05-12

I ricercatori propongono Evolving-RL, un framework che ottimizza congiuntamente l'estrazione e l'utilizzo dell'esperienza in agenti basati su modelli linguistici di grandi dimensioni. I sistemi auto-evolventi esistenti si concentrano sulla progettazione a livello di sistema, trascurando le capacità del modello. Evolving-RL tratta l'auto-evoluzione come un processo unificato, utilizzando l'apprendimento per rinforzo per migliorare sia l'astrazione che l'apprendimento contestuale. L'approccio si concentra sull'ottimizzazione end-to-end della capacità dell'agente di adattarsi dalle interazioni passate. L'articolo è disponibile su arXiv con ID 2605.10663.

Fatti principali

Evolving-RL è un framework algoritmico per agenti auto-evolventi
Ottimizza congiuntamente l'estrazione e l'utilizzo dell'esperienza
Gli studi esistenti si concentrano sulla progettazione a livello di sistema, non sulle capacità del modello
Il framework utilizza l'apprendimento per rinforzo per l'ottimizzazione
Mira a migliorare astrazione, generalizzazione e apprendimento contestuale
L'articolo è pubblicato su arXiv con ID 2605.10663
Gli agenti auto-evolventi superano la natura statica dei LLM distillando l'esperienza
L'approccio tratta l'auto-evoluzione come un processo unificato

Evolving-RL: Ottimizzazione Congiunta di Agenti Auto-Evolventi Guidati dall'Esperienza

Fatti principali

Entità

Istituzioni

Fonti