StructMem: Memoria Strutturata per Comportamenti a Lungo Termine nei LLM
È stato introdotto un nuovo modello di memoria gerarchica chiamato StructMem per migliorare gli agenti conversazionali a lungo termine. Questo framework si concentra sulle connessioni tra eventi piuttosto che su semplici fatti isolati, facilitando il ragionamento temporale e la risposta a domande multi-hop. I metodi esistenti incontrano un dilemma: la memoria piatta è efficiente ma manca di modellazione relazionale, mentre la memoria basata su grafi supporta il ragionamento strutturato ma è costosa e fragile. StructMem mantiene i legami a livello di evento e stabilisce collegamenti tra eventi ancorando temporalmente due punti di vista e conducendo una regolare consolidazione semantica. Dimostra un miglioramento nel ragionamento temporale e nelle capacità multi-hop sul benchmark LoCoMo, riducendo al contempo l'uso di token, le chiamate API e il tempo di esecuzione rispetto ai precedenti sistemi di memoria. La ricerca è disponibile su arXiv.
Fatti principali
- StructMem è un framework di memoria gerarchica arricchita di struttura per LLM.
- Affronta il compromesso tra memoria piatta e memoria basata su grafi.
- Preserva i legami a livello di evento e induce connessioni tra eventi.
- Utilizza prospettive duali ancorate temporalmente e consolidazione semantica periodica.
- Migliora le prestazioni sul benchmark LoCoMo.
- Riduce l'uso di token, le chiamate API e il tempo di esecuzione.
- L'articolo proviene dalla categoria Computer Science > Computation and Language.
- L'ID arXiv è 2604.21748.
Entità
Istituzioni
- arXiv