Apprendimento di Abilità a Contesto Costante per Agenti LLM

ai-technology · 2026-05-09

Un nuovo approccio chiamato apprendimento di abilità a contesto costante affronta la sfida di bilanciare privacy, costo e capacità negli assistenti personali basati su LLM. Mentre i modelli cloud gestiscono flussi di lavoro complessi, rischiano di rivelare informazioni sensibili a API esterne; al contrario, i modelli locali mantengono la privacy ma mancano di affidabilità. Questo nuovo metodo sviluppa strategie riutilizzabili all'interno di moduli leggeri specifici per famiglia di compiti, basandosi esclusivamente sulle osservazioni correnti e su un blocco di stato conciso per l'inferenza. Un tracciatore deterministico crea questo stato in base all'avanzamento del compito e fornisce ricompense di sottobiettivo per l'addestramento SFT e RL online a livello di passo. Il metodo è stato testato su ALFWorld, WebShop e SciWorld.

Fatti principali

arXiv:2605.05413v1
Tipo di annuncio: nuovo
Propone l'apprendimento di abilità a contesto costante
Framework contesto-pesi per flussi di lavoro ricorrenti degli agenti
Procedure riutilizzabili apprese in moduli leggeri specifici per famiglia di compiti
L'inferenza si basa solo sull'osservazione corrente e su un blocco di stato compatto
Un tracciatore deterministico genera il blocco di stato dall'avanzamento del compito
Testato su ALFWorld, WebShop e SciWorld

Apprendimento di Abilità a Contesto Costante per Agenti LLM

Fatti principali

Entità

Istituzioni

Fonti