LightMem: Memoria Leggera per Agenti LLM con Modelli Linguistici Piccoli
Un nuovo sistema di memoria chiamato LightMem utilizza modelli linguistici piccoli (SLM) per migliorare la memoria degli agenti LLM. Modularizza il recupero, la scrittura e il consolidamento, separando l'elaborazione online dal consolidamento offline per l'efficienza. La memoria è organizzata in memoria a breve termine (STM), medio termine (MTM) e lungo termine. Il sistema mira a ridurre la latenza mantenendo l'accuratezza rispetto agli approcci basati su modelli grandi.
Fatti principali
- LightMem è un sistema di memoria leggero per agenti LLM.
- Utilizza modelli linguistici piccoli (SLM) invece di modelli grandi.
- Le operazioni di memoria sono modularizzate in recupero, scrittura e consolidamento.
- L'elaborazione online è separata dal consolidamento offline.
- La memoria è organizzata in memoria a breve termine (STM), medio termine (MTM) e lungo termine.
- Il sistema mira a ridurre la latenza nelle interazioni a lungo orizzonte.
- Affronta problemi di accuratezza nei sistemi di memoria esterna basati su recupero.
- L'articolo è disponibile su arXiv con ID 2604.07798.
Entità
Istituzioni
- arXiv