RecMem: Consolidamento Efficiente della Memoria per Agenti LLM a Lunga Durata
RecMem è un sistema di memoria innovativo progettato per agenti LLM a lunga durata che riduce il consumo di token ripensando a quando avviene il consolidamento della memoria. I sistemi tradizionali invocano gli LLM per ogni interazione in arrivo, portando a costi elevati. RecMem memorizza le interazioni in uno strato subconscio utilizzando embedding leggeri per il recupero, attivando gli LLM solo quando viene rilevata una ricorrenza sostenuta di interazioni semanticamente simili. Questo approccio basato sulla ricorrenza garantisce l'estrazione solo per cluster semantici ricchi, migliorando l'efficienza senza sacrificare l'accuratezza. Il sistema affronta le finestre di contesto limitate degli LLM organizzando le interazioni utente-agente in memoria esterna recuperabile.
Fatti principali
- 1. RecMem sta per Consolidamento della Memoria Basato sulla Ricorrenza.
- 2. È mirato ad agenti LLM a lunga durata.
- 3. I sistemi di memoria esistenti utilizzano il consolidamento eager, invocando gli LLM per ogni interazione.
- 4. RecMem utilizza uno strato di memoria subconscia con embedding leggeri.
- 5. Gli LLM vengono invocati solo quando si osserva una ricorrenza sostenuta di interazioni semanticamente simili.
- 6. Il consolidamento basato sulla ricorrenza estrae memoria episodica e semantica.
- 7. L'approccio riduce il consumo di token.
- 8. L'articolo proviene da arXiv con ID 2605.16045.
Entità
Istituzioni
- arXiv