xMAE: Ricostruzione Cross-Modale Mascherata per l'Apprendimento di Biosignali
I ricercatori introducono xMAE, un framework di pre-addestramento auto-supervisionato per l'apprendimento di rappresentazioni di biosignali. Sfrutta la ricostruzione cross-modale mascherata tra biosignali temporalmente ordinati, come ECG e PPG, per catturare le dinamiche temporali direzionali. Il metodo supera le baseline unimodali e multimodali imponendo una struttura temporale fisiologicamente significativa.
Fatti principali
- xMAE utilizza la ricostruzione cross-modale mascherata per il pre-addestramento di biosignali.
- Modella le dinamiche temporali direzionali tra segnali ECG e PPG.
- L'ECG cattura l'attivazione elettrica del battito cardiaco; il PPG registra il polso periferico ritardato dalle dinamiche vascolari.
- Il framework incoraggia una struttura temporale fisiologicamente significativa nelle rappresentazioni apprese.
- Il pre-addestramento con xMAE supera gli approcci unimodali e multimodali.
- L'articolo è disponibile su arXiv con ID 2605.00973.
- Il metodo tratta i biosignali come viste temporalmente ordinate dello stesso processo fisiologico.
- I metodi auto-supervisionati esistenti spesso trascurano le dinamiche temporali direzionali.
Entità
Istituzioni
- arXiv