MUSE-Autoskill: Agenti LLM auto-evolventi tramite ciclo di vita delle abilità
I ricercatori propongono MUSE-Autoskill Agent, un framework che consente agli agenti basati su modelli linguistici di grandi dimensioni (LLM) di migliorare continuamente la risoluzione dei compiti creando, riutilizzando e perfezionando le abilità in un ciclo di vita unificato. Il sistema include la creazione di abilità su richiesta, l'archiviazione e il riutilizzo tra compiti, l'organizzazione e la selezione efficienti, e la valutazione tramite test unitari e feedback in tempo reale. Introduce una memoria a livello di abilità per accumulare esperienza per ogni abilità attraverso i compiti. Esperimenti iniziali su SkillsBench mostrano risultati promettenti. L'articolo è disponibile su arXiv (2605.27366).
Fatti principali
- MUSE-Autoskill Agent è un framework incentrato sulle abilità per agenti LLM.
- Unifica creazione, memoria, gestione, valutazione e perfezionamento delle abilità.
- Le abilità vengono create su richiesta e riutilizzate tra compiti.
- La memoria a livello di abilità accumula esperienza per ogni abilità.
- La valutazione utilizza test unitari e feedback in tempo reale.
- Gli esperimenti sono stati condotti su SkillsBench.
- L'articolo è su arXiv con ID 2605.27366.
- L'approccio mira a migliorare riutilizzabilità, affidabilità e miglioramento a lungo termine.
Entità
Istituzioni
- arXiv