SkillGrad: un framework ispirato alla discesa del gradiente per ottimizzare le abilità degli agenti LLM

ai-technology · 2026-05-28

I ricercatori propongono SkillGrad, un framework che ottimizza le abilità degli agenti per LLM utilizzando un approccio ispirato alla discesa del gradiente. Le abilità, memorizzate come file strutturati, adattano gli agenti a domini specializzati ma spesso soffrono di inaffidabilità o incompletezza. SkillGrad tratta i pacchetti di abilità come parametri, utilizzando le perdite di esecuzione dei compiti come evidenza a livello di traiettoria e diagnosi automatiche per generare gradienti testuali per la correzione. Un agente momentum accumula schemi diagnostici ricorrenti in una memoria persistente, e un patcher basato su LLM esegue gli aggiornamenti. L'articolo è disponibile su arXiv con identificatore 2605.27760.

Fatti principali

SkillGrad è un framework ispirato alla discesa del gradiente per ottimizzare le abilità degli agenti.
Le abilità degli agenti sono file strutturati leggeri per adattare gli agenti LLM a domini specializzati.
I metodi esistenti di evoluzione delle abilità si basano su riflessioni euristiche senza ottimizzazione esplicita.
SkillGrad tratta i pacchetti di abilità come parametri da ottimizzare in modo simile alla discesa del gradiente.
Le esecuzioni dei compiti forniscono evidenza di perdita a livello di traiettoria per l'ottimizzazione.
Le diagnosi automatiche generano gradienti testuali che indicano le direzioni di correzione.
Un agente momentum accumula schemi diagnostici ricorrenti in una sovrapposizione di memoria persistente.
Un patcher basato su LLM esegue gli aggiornamenti basati sulla memoria accumulata.

SkillGrad: un framework ispirato alla discesa del gradiente per ottimizzare le abilità degli agenti LLM

Fatti principali

Entità

Istituzioni

Fonti