ARTFEED — Contemporary Art Intelligence

SkillGrad: un framework ispirato alla discesa del gradiente per ottimizzare le abilità degli agenti LLM

ai-technology · 2026-05-28

I ricercatori propongono SkillGrad, un framework che ottimizza le abilità degli agenti per LLM utilizzando un approccio ispirato alla discesa del gradiente. Le abilità, memorizzate come file strutturati, adattano gli agenti a domini specializzati ma spesso soffrono di inaffidabilità o incompletezza. SkillGrad tratta i pacchetti di abilità come parametri, utilizzando le perdite di esecuzione dei compiti come evidenza a livello di traiettoria e diagnosi automatiche per generare gradienti testuali per la correzione. Un agente momentum accumula schemi diagnostici ricorrenti in una memoria persistente, e un patcher basato su LLM esegue gli aggiornamenti. L'articolo è disponibile su arXiv con identificatore 2605.27760.

Fatti principali

  • SkillGrad è un framework ispirato alla discesa del gradiente per ottimizzare le abilità degli agenti.
  • Le abilità degli agenti sono file strutturati leggeri per adattare gli agenti LLM a domini specializzati.
  • I metodi esistenti di evoluzione delle abilità si basano su riflessioni euristiche senza ottimizzazione esplicita.
  • SkillGrad tratta i pacchetti di abilità come parametri da ottimizzare in modo simile alla discesa del gradiente.
  • Le esecuzioni dei compiti forniscono evidenza di perdita a livello di traiettoria per l'ottimizzazione.
  • Le diagnosi automatiche generano gradienti testuali che indicano le direzioni di correzione.
  • Un agente momentum accumula schemi diagnostici ricorrenti in una sovrapposizione di memoria persistente.
  • Un patcher basato su LLM esegue gli aggiornamenti basati sulla memoria accumulata.

Entità

Istituzioni

  • arXiv

Fonti