Ottimizzazione del Gradiente di Rete Meta-Adattiva per l'Apprendimento Continuo Online

other · 2026-05-20

Un nuovo metodo chiamato Meta-Adaptive Network Gradient Optimization (MANGO) viene proposto per affrontare l'oblio catastrofico nell'Apprendimento Continuo Online (OCL). L'OCL implica una rete neurale che apprende sequenzialmente da un flusso di dati non stazionario in un unico passaggio con un buffer di replay di memoria limitato, a differenza dell'apprendimento continuo offline che si basa su più epoche su grandi set di dati. La sfida principale è bilanciare la stabilità (mantenere i compiti passati) e la plasticità (apprendere nuovi compiti). Gli approcci esistenti come il rehearsal basato su replay, la distillazione a livello di output, la regolarizzazione fissa e il meta-apprendimento solo su flusso hanno limitazioni: il rehearsal introduce un bias dei campioni memorizzati; la distillazione non modula gli aggiornamenti dei parametri; la regolarizzazione fissa penalizza i parametri indipendentemente dalla sensibilità; il meta-apprendimento solo su flusso manca di aggiornamenti dei parametri controllati da feedback. MANGO mira a superare questi problemi introducendo un framework di ottimizzazione del gradiente meta-adattivo che regola dinamicamente gli aggiornamenti dei parametri in base alla rilevanza e alla sensibilità del compito. Il metodo è dettagliato in un preprint su arXiv (2605.19080).

Fatti principali

MANGO è proposto per l'Apprendimento Continuo Online.
L'OCL implica l'apprendimento in un unico passaggio da un flusso di dati non stazionario.
Nell'OCL è disponibile solo un buffer di replay di memoria limitato.
L'oblio catastrofico è la sfida principale.
I metodi esistenti includono replay, distillazione, regolarizzazione e meta-apprendimento.
Il replay introduce un bias dei campioni memorizzati.
La distillazione non modula gli aggiornamenti dei parametri.
La regolarizzazione fissa penalizza i parametri indipendentemente dalla sensibilità.
Il meta-apprendimento solo su flusso manca di aggiornamenti dei parametri controllati da feedback.
MANGO è un metodo di ottimizzazione del gradiente di rete meta-adattivo.
Il preprint è su arXiv con ID 2605.19080.

Ottimizzazione del Gradiente di Rete Meta-Adattiva per l'Apprendimento Continuo Online

Fatti principali

Entità

Istituzioni

Fonti