Nuovo Modello di Framework: Memoria LLM come Matrice di Markov per l'Espansione della Conoscenza

publication · 2026-05-07

Un nuovo articolo di ricerca propone un framework che modella la generazione autoregressiva del linguaggio nei grandi modelli linguistici come un processo di Markov sui token, con la memoria del modello rappresentata da una matrice di transizione di Markov. Questo approccio mira a affrontare l'oblio catastrofico durante l'incorporazione continua della conoscenza estendendo lo spazio degli stati per nuove conoscenze, preservando al contempo le transizioni esistenti per mantenere le informazioni apprese in precedenza. L'articolo sostiene che aggiornamenti su larga scala dei pesi potrebbero non essere necessari per acquisire piccole quantità di nuova conoscenza, offrendo un'alternativa più efficiente in termini di campioni rispetto agli algoritmi di aggiornamento dei parametri. Il lavoro è pubblicato su arXiv con identificatore 2605.04308.

Fatti principali

L'articolo propone di modellare la memoria LLM come una matrice di transizione di Markov.
Affronta l'oblio catastrofico nell'incorporazione continua della conoscenza.
La nuova conoscenza corrisponde all'estensione dello spazio degli stati.
Le transizioni esistenti vengono preservate per mantenere la conoscenza appresa.
Sostiene che aggiornamenti su larga scala dei pesi potrebbero non essere necessari per piccole aggiunte di conoscenza.
Pubblicato su arXiv con ID 2605.04308.
Il framework è basato su principi ed efficiente in termini di campioni.
Mira all'evoluzione a lungo termine dei grandi modelli linguistici.

Nuovo Modello di Framework: Memoria LLM come Matrice di Markov per l'Espansione della Conoscenza

Fatti principali

Entità

Istituzioni

Fonti