SkillFlow: Evoluzione Ricorsiva delle Competenze Guidata dal Flusso per l'Orchestrazione Agente
SkillFlow, un framework di recente introduzione, affronta problemi significativi nei sistemi agente basati su LLM per la gestione dei compiti, come il fallimento della strategia, l'eccessiva varianza del gradiente e lo sviluppo non regolamentato delle competenze. Incorpora un agente Supervisore addestrabile, un ambiente strutturato con una libreria di competenze dinamica e un esecutore fisso per facilitare interazioni multi-turno automatizzate. Il framework utilizza il Tempered Trajectory Balance (TTB), una loss di flow-matching basata sulla regressione che seleziona le traiettorie in base alla ricompensa, garantendo il mantenimento di una varietà di strategie di orchestrazione. Questa ricerca è disponibile su arXiv con ID 2605.14089.
Fatti principali
- SkillFlow è un framework basato sul flusso per sistemi agente basati su LLM.
- Affronta il collasso della strategia sotto massimizzazione della ricompensa.
- Affronta l'elevata varianza del gradiente con attribuzione opaca del credito.
- Affronta l'evoluzione non guidata delle competenze.
- SkillFlow utilizza un agente Supervisore addestrabile.
- Impiega un ambiente strutturato con libreria di competenze dinamica ed esecutore congelato.
- Utilizza il Tempered Trajectory Balance (TTB) come loss di flow-matching basata sulla regressione.
- L'articolo è disponibile su arXiv con ID 2605.14089.
Entità
Istituzioni
- arXiv