ARTFEED — Contemporary Art Intelligence

TSN-Affinity: Riutilizzo dei Parametri per RL Offline Continua

other · 2026-04-30

I ricercatori propongono TSN-Affinity, un metodo per l'apprendimento per rinforzo offline continuo (CORL) che utilizza TinySubNetworks e Decision Transformer per consentire il riutilizzo dei parametri specifici del compito. CORL implica l'apprendimento da dataset statici attraverso compiti sequenziali, evitando la dimenticanza catastrofica. I metodi basati su replay soffrono di overhead di memoria e disallineamento della distribuzione, mentre gli approcci architetturali rimangono poco esplorati in CORL. TSN-Affinity affronta queste sfide sfruttando il riutilizzo dei parametri guidato dalla similarità.

Fatti principali

  • TSN-Affinity è un metodo CORL basato su TinySubNetworks e Decision Transformer.
  • CORL apprende una sequenza di compiti da dataset offline.
  • I metodi basati su replay hanno overhead di memoria e disallineamento della distribuzione.
  • I metodi architetturali sono poco esplorati in CORL.
  • Il metodo consente il riutilizzo dei parametri specifici del compito.

Entità

Istituzioni

  • arXiv

Fonti