TPGO: Un Framework di Auto-Miglioramento per Sistemi Multi-Agente tramite Ottimizzazione di Grafi di Parametri Testuali
I ricercatori hanno introdotto un nuovo framework noto come Textual Parameter Graph Optimization (TPGO) per promuovere lo sviluppo autonomo di sistemi multi-agente. In questa configurazione, questi sistemi sono rappresentati come Grafi di Parametri Testuali (TPG), con agenti, strumenti e flussi di lavoro che fungono da componenti modulari e regolabili. Il framework utilizza 'gradienti testuali'—feedback in linguaggio naturale provenienti dai log di esecuzione—per individuare problemi e suggerire modifiche precise. Al suo cuore si trova il metodo Group Relative Agent Optimization (GRAO), che consente al sistema di affinare le proprie strategie di ottimizzazione nel tempo, superando i limiti degli ottimizzatori statici esistenti che mancano di consapevolezza strutturale o di apprendimento dall'esperienza. Questo lavoro affronta le complessità dell'Ingegneria degli Agenti nella creazione e ottimizzazione di sistemi multi-agente.
Fatti principali
- TPGO modella i MAS come un Grafo di Parametri Testuali (TPG) con nodi modulari.
- I gradienti testuali sono derivati dalle tracce di esecuzione per guidare l'evoluzione.
- GRAO è una nuova strategia di meta-apprendimento per l'auto-miglioramento.
- I metodi di ottimizzazione automatica esistenti si concentrano sull'ottimizzazione piatta dei prompt.
- Gli ottimizzatori attuali sono statici e non apprendono dall'esperienza.
- TPGO consente a un sistema multi-agente di imparare ad evolversi.
- Il framework individua i fallimenti e suggerisce modifiche granulari.
- Il lavoro affronta la complessità dell'Ingegneria degli Agenti.
Entità
Istituzioni
- arXiv