SkillGrad: un framework ispirato alla discesa del gradiente per ottimizzare le abilità degli agenti LLM
I ricercatori propongono SkillGrad, un framework che ottimizza le abilità degli agenti per LLM utilizzando un approccio ispirato alla discesa del gradiente. Le abilità, memorizzate come file strutturati, adattano gli agenti a domini specializzati ma spesso soffrono di inaffidabilità o incompletezza. SkillGrad tratta i pacchetti di abilità come parametri, utilizzando le perdite di esecuzione dei compiti come evidenza a livello di traiettoria e diagnosi automatiche per generare gradienti testuali per la correzione. Un agente momentum accumula schemi diagnostici ricorrenti in una memoria persistente, e un patcher basato su LLM esegue gli aggiornamenti. L'articolo è disponibile su arXiv con identificatore 2605.27760.
Fatti principali
- SkillGrad è un framework ispirato alla discesa del gradiente per ottimizzare le abilità degli agenti.
- Le abilità degli agenti sono file strutturati leggeri per adattare gli agenti LLM a domini specializzati.
- I metodi esistenti di evoluzione delle abilità si basano su riflessioni euristiche senza ottimizzazione esplicita.
- SkillGrad tratta i pacchetti di abilità come parametri da ottimizzare in modo simile alla discesa del gradiente.
- Le esecuzioni dei compiti forniscono evidenza di perdita a livello di traiettoria per l'ottimizzazione.
- Le diagnosi automatiche generano gradienti testuali che indicano le direzioni di correzione.
- Un agente momentum accumula schemi diagnostici ricorrenti in una sovrapposizione di memoria persistente.
- Un patcher basato su LLM esegue gli aggiornamenti basati sulla memoria accumulata.
Entità
Istituzioni
- arXiv