Apprendimento di Abilità a Contesto Costante per Agenti LLM
Un nuovo approccio chiamato apprendimento di abilità a contesto costante affronta la sfida di bilanciare privacy, costo e capacità negli assistenti personali basati su LLM. Mentre i modelli cloud gestiscono flussi di lavoro complessi, rischiano di rivelare informazioni sensibili a API esterne; al contrario, i modelli locali mantengono la privacy ma mancano di affidabilità. Questo nuovo metodo sviluppa strategie riutilizzabili all'interno di moduli leggeri specifici per famiglia di compiti, basandosi esclusivamente sulle osservazioni correnti e su un blocco di stato conciso per l'inferenza. Un tracciatore deterministico crea questo stato in base all'avanzamento del compito e fornisce ricompense di sottobiettivo per l'addestramento SFT e RL online a livello di passo. Il metodo è stato testato su ALFWorld, WebShop e SciWorld.
Fatti principali
- arXiv:2605.05413v1
- Tipo di annuncio: nuovo
- Propone l'apprendimento di abilità a contesto costante
- Framework contesto-pesi per flussi di lavoro ricorrenti degli agenti
- Procedure riutilizzabili apprese in moduli leggeri specifici per famiglia di compiti
- L'inferenza si basa solo sull'osservazione corrente e su un blocco di stato compatto
- Un tracciatore deterministico genera il blocco di stato dall'avanzamento del compito
- Testato su ALFWorld, WebShop e SciWorld
Entità
Istituzioni
- arXiv