ARTFEED — Contemporary Art Intelligence

Apprendimento di Abilità a Contesto Costante per Agenti LLM

ai-technology · 2026-05-09

Un nuovo approccio chiamato apprendimento di abilità a contesto costante affronta la sfida di bilanciare privacy, costo e capacità negli assistenti personali basati su LLM. Mentre i modelli cloud gestiscono flussi di lavoro complessi, rischiano di rivelare informazioni sensibili a API esterne; al contrario, i modelli locali mantengono la privacy ma mancano di affidabilità. Questo nuovo metodo sviluppa strategie riutilizzabili all'interno di moduli leggeri specifici per famiglia di compiti, basandosi esclusivamente sulle osservazioni correnti e su un blocco di stato conciso per l'inferenza. Un tracciatore deterministico crea questo stato in base all'avanzamento del compito e fornisce ricompense di sottobiettivo per l'addestramento SFT e RL online a livello di passo. Il metodo è stato testato su ALFWorld, WebShop e SciWorld.

Fatti principali

  • arXiv:2605.05413v1
  • Tipo di annuncio: nuovo
  • Propone l'apprendimento di abilità a contesto costante
  • Framework contesto-pesi per flussi di lavoro ricorrenti degli agenti
  • Procedure riutilizzabili apprese in moduli leggeri specifici per famiglia di compiti
  • L'inferenza si basa solo sull'osservazione corrente e su un blocco di stato compatto
  • Un tracciatore deterministico genera il blocco di stato dall'avanzamento del compito
  • Testato su ALFWorld, WebShop e SciWorld

Entità

Istituzioni

  • arXiv

Fonti