VCR: Framework Auto-Supervisionato per Segnali Indossabili Incompleti
Un team di ricercatori ha introdotto VCR, un framework di apprendimento auto-supervisionato progettato per ottenere rappresentazioni accurate resistenti a modalità assenti nei dati provenienti da dispositivi indossabili. Le tecniche esistenti spesso tentano di ricostruire segnali mancanti, il che può portare a dettagli inventati. VCR utilizza un tokenizer ortogonale per garantire una chiara separazione attraverso varietà latenti rettificate e proiezione geometrica, distinguendo ogni modalità in semantica comune e residui specifici. Questo metodo mantiene l'integrità delle informazioni migliorando al contempo la robustezza. Affronta efficacemente il problema diffuso dell'incompletezza dei sensori e la scarsità di dati etichettati in scenari pratici di monitoraggio sanitario.
Fatti principali
- VCR sta per Learning Valid Contextual Representation for Incomplete Wearable Signals.
- L'articolo è pubblicato su arXiv con ID 2605.18837.
- I dispositivi indossabili consentono il monitoraggio continuo della salute tramite segnali multimodali.
- L'implementazione nel mondo reale è ostacolata dalla scarsità di dati etichettati e dall'incompletezza pervasiva dei sensori.
- La maggior parte dei metodi auto-supervisionati esistenti presuppone la piena disponibilità delle modalità.
- Gli approcci attuali per gestire le modalità mancanti spesso ricostruiscono interi segnali assenti.
- La ricostruzione può incoraggiare l'allucinazione di dettagli specifici della modalità non deducibili dai segnali osservati.
- VCR impiega un tokenizer ortogonale per imporre un rigoroso disaccoppiamento ortogonale.
- Il tokenizer rettifica le varietà latenti e applica la proiezione geometrica.
- Ogni modalità viene separata in semantica condivisa e residui specifici della modalità.
Entità
Istituzioni
- arXiv