xMAE: Ricostruzione Cross-Modale Mascherata per l'Apprendimento di Biosignali

other · 2026-05-06

I ricercatori introducono xMAE, un framework di pre-addestramento auto-supervisionato per l'apprendimento di rappresentazioni di biosignali. Sfrutta la ricostruzione cross-modale mascherata tra biosignali temporalmente ordinati, come ECG e PPG, per catturare le dinamiche temporali direzionali. Il metodo supera le baseline unimodali e multimodali imponendo una struttura temporale fisiologicamente significativa.

Fatti principali

xMAE utilizza la ricostruzione cross-modale mascherata per il pre-addestramento di biosignali.
Modella le dinamiche temporali direzionali tra segnali ECG e PPG.
L'ECG cattura l'attivazione elettrica del battito cardiaco; il PPG registra il polso periferico ritardato dalle dinamiche vascolari.
Il framework incoraggia una struttura temporale fisiologicamente significativa nelle rappresentazioni apprese.
Il pre-addestramento con xMAE supera gli approcci unimodali e multimodali.
L'articolo è disponibile su arXiv con ID 2605.00973.
Il metodo tratta i biosignali come viste temporalmente ordinate dello stesso processo fisiologico.
I metodi auto-supervisionati esistenti spesso trascurano le dinamiche temporali direzionali.

xMAE: Ricostruzione Cross-Modale Mascherata per l'Apprendimento di Biosignali

Fatti principali

Entità

Istituzioni

Fonti