Architettura di Memoria a Doppio Processo per Agenti LLM Scientifici
Uno studio recente presenta un'Architettura di Memoria a Doppio Processo volta a risolvere la saturazione della finestra di contesto nei Large Language Models (LLM) per compiti scientifici estesi. Questa architettura distingue tra requisiti episodici a breve termine, mantenuti in una finestra fissa di 10 messaggi, e conoscenza accumulata a lungo termine, che aumenta a circa 3 token per messaggio. A differenza dei precedenti sistemi di memoria per agenti sociali, questo metodo specializzato gestisce efficacemente cambiamenti di parametri conflittuali, facilita il ragionamento multi-hop attraverso varie fasi sperimentali e garantisce una conservazione accurata dei fatti tecnici. L'architettura è stata testata con 15.000 messaggi e validata su sei LLM appartenenti a tre diverse famiglie: OpenAI, Anthropic e Google.
Fatti principali
- L'Architettura di Memoria a Doppio Processo disaccoppia la memoria episodica da quella semantica
- La memoria episodica utilizza una finestra costante di 10 messaggi
- La memoria semantica cresce a circa 3 token per messaggio
- Il consolidamento specifico del dominio affronta l'evoluzione contraddittoria dei parametri
- Supporta il ragionamento multi-hop attraverso le fasi sperimentali
- La valutazione ha coperto 15.000 messaggi
- Validazione incrociata su sei LLM di OpenAI, Anthropic e Google
- Mira a risolvere la saturazione della finestra di contesto nei flussi di lavoro scientifici
Entità
Istituzioni
- OpenAI
- Anthropic