Grafici di Sottocompiti Ciclici Completati per Agenti LLM che Utilizzano Strumenti
Uno studio pubblicato su arXiv (2604.22820) presenta grafici di sottocompiti ciclici completati, che rappresentano un framework multi-agente altamente adattabile per compiti a lungo termine che coinvolgono strumenti. Questa architettura presenta nodi di sottocompiti eseguibili completamente interconnessi, mentre un agente centralizzato per l'analisi dello stato e il routing determina le transizioni basate su criteri in linguaggio naturale, consentendo la rivisitazione illimitata dei sottocompiti sia per scopi di recupero che di esplorazione. La ricerca valuta grafici specifici per compito (Spec-Cyc) e generici per benchmark (Gen-Cyc) sui benchmark TextCraft, ALFWorld e Finance-Agent. L'analisi include variazioni nelle capacità di planner/esecutore/router, esposizione agli strumenti (generalista vs specializzato), riepiloghi di traiettorie di successo n-shot e perturbazioni casuali dei sottocompiti indotte da guasti. I risultati indicano tre regimi operativi distinti, con ALFWorld che rivela un collo di bottiglia significativo.
Fatti principali
- L'articolo arXiv 2604.22820 introduce grafici di sottocompiti ciclici completati.
- L'architettura consente la rivisitazione illimitata dei sottocompiti.
- Un agente unificato di analisi dello stato e routing utilizza criteri in linguaggio naturale.
- Valutato sui benchmark TextCraft, ALFWorld e Finance-Agent.
- Le ablazioni includono la forza del planner/esecutore/router e l'esposizione agli strumenti.
- Identificati tre regimi di prestazioni distinti.
- ALFWorld evidenzia un collo di bottiglia.
- La ricerca si concentra sui compromessi tra flessibilità e costo.
Entità
Istituzioni
- arXiv