Mem-π: Memoria Adattiva per Agenti LLM Genera Guida Specifica al Contesto
Mem-π è un sistema innovativo progettato per migliorare gli agenti basati su grandi modelli linguistici (LLM) introducendo una memoria flessibile che fornisce aiuto tempestivo e pertinente, invece di utilizzare solo informazioni fisse provenienti da fonti esterne. A differenza degli agenti tradizionali con memoria potenziata che spesso attingono da esperienze passate o set di competenze, Mem-π utilizza un modello linguistico o visione-linguistico unico con i propri parametri. Questo modello valuta la situazione attuale dell'agente per decidere il consiglio più utile da fornire. È stato addestrato con un approccio speciale di apprendimento per rinforzo che lo aiuta a evitare risposte irrilevanti, garantendo una guida chiara e utile. L'efficacia di questo framework è stata testata su diversi benchmark, tra cui navigazione web e attività da terminale.
Fatti principali
- Mem-π è un framework per la memoria adattiva negli agenti LLM.
- Genera guida su richiesta anziché recuperarla da memoria esterna.
- I metodi esistenti si basano sul recupero per similarità che spesso non è allineato al contesto.
- Mem-π utilizza un modello linguistico o visione-linguistico dedicato separato dall'agente a valle.
- Il modello decide congiuntamente quando e quale guida produrre.
- È addestrato con un obiettivo di apprendimento per rinforzo che disaccoppia decisione e contenuto.
- Il framework può astenersi dal generare guida non utile.
- Testato su benchmark tra cui navigazione web e attività da terminale.
Entità
Istituzioni
- arXiv