TSN-Affinity: Riutilizzo dei Parametri per RL Offline Continua
I ricercatori propongono TSN-Affinity, un metodo per l'apprendimento per rinforzo offline continuo (CORL) che utilizza TinySubNetworks e Decision Transformer per consentire il riutilizzo dei parametri specifici del compito. CORL implica l'apprendimento da dataset statici attraverso compiti sequenziali, evitando la dimenticanza catastrofica. I metodi basati su replay soffrono di overhead di memoria e disallineamento della distribuzione, mentre gli approcci architetturali rimangono poco esplorati in CORL. TSN-Affinity affronta queste sfide sfruttando il riutilizzo dei parametri guidato dalla similarità.
Fatti principali
- TSN-Affinity è un metodo CORL basato su TinySubNetworks e Decision Transformer.
- CORL apprende una sequenza di compiti da dataset offline.
- I metodi basati su replay hanno overhead di memoria e disallineamento della distribuzione.
- I metodi architetturali sono poco esplorati in CORL.
- Il metodo consente il riutilizzo dei parametri specifici del compito.
Entità
Istituzioni
- arXiv