TSN-Affinity: Riutilizzo dei Parametri per RL Offline Continua

other · 2026-04-30

I ricercatori propongono TSN-Affinity, un metodo per l'apprendimento per rinforzo offline continuo (CORL) che utilizza TinySubNetworks e Decision Transformer per consentire il riutilizzo dei parametri specifici del compito. CORL implica l'apprendimento da dataset statici attraverso compiti sequenziali, evitando la dimenticanza catastrofica. I metodi basati su replay soffrono di overhead di memoria e disallineamento della distribuzione, mentre gli approcci architetturali rimangono poco esplorati in CORL. TSN-Affinity affronta queste sfide sfruttando il riutilizzo dei parametri guidato dalla similarità.

Fatti principali

TSN-Affinity è un metodo CORL basato su TinySubNetworks e Decision Transformer.
CORL apprende una sequenza di compiti da dataset offline.
I metodi basati su replay hanno overhead di memoria e disallineamento della distribuzione.
I metodi architetturali sono poco esplorati in CORL.
Il metodo consente il riutilizzo dei parametri specifici del compito.

TSN-Affinity: Riutilizzo dei Parametri per RL Offline Continua

Fatti principali

Entità

Istituzioni

Fonti