TSFMAudit: Rilevamento della Contaminazione nei Modelli Fondamentali di Serie Temporali
TSFMAudit, una tecnica innovativa, identifica la contaminazione nei dati di pre-addestramento per i modelli fondamentali di serie temporali (TSFM). Questo metodo valuta la contaminazione analizzando l'efficienza di adattamento durante il processo di fine-tuning; i dataset contaminati mostrano una diminuzione più rapida della perdita con un movimento minimo del backbone. Questo approccio è stato testato su 6 TSFM e 187 dataset, utilizzando fonti di addestramento verificate. TSFMAudit rappresenta il primo sforzo per affrontare la verifica della contaminazione da pre-addestramento specificamente per i TSFM.
Fatti principali
- TSFMAudit è il primo metodo per la verifica della contaminazione da pre-addestramento nei TSFM.
- Utilizza le dinamiche di adattamento probe per rilevare la contaminazione.
- I dataset contaminati mostrano una riduzione più rapida della perdita e un movimento minore del backbone durante il fine-tuning.
- Valutato su 6 TSFM e 187 dataset.
- La valutazione utilizza prove documentate delle fonti di addestramento come supervisione.
- I segnali delle serie temporali sono continui ed eterogenei, complicando la verifica.
- Il lavoro affronta le preoccupazioni riguardanti stime di performance eccessivamente ottimistiche dovute alla contaminazione.
- Il metodo è formalizzato come un approccio di verifica basato su probe.
Entità
Istituzioni
- arXiv