CLMT: Un Modello Fondamentale a Efficienza Parametrica per la Sintesi di Segnali Fisiologici
I ricercatori propongono Compact Latent Manifold Translation (CLMT), un framework unificato da 0,09 miliardi di parametri per la sintesi cross-modale e cross-frequenza di segnali fisiologici come ECG e PPG. CLMT utilizza un paradigma di traduzione discreta a due stadi: un Tokenizer Universale con Quantizzazione Vettoriale Residua Gerarchica (RVQ) separa i segnali eterogenei in varietà latenti discrete isolate, prevenendo l'interferenza tra le modalità. Un Trasformatore Latente con Prompt Contestuale consente quindi una generazione ad alta fedeltà tra modalità e frequenze. Il modello affronta l'intreccio tra modalità e gli alti costi computazionali nei modelli fondamentali esistenti, puntando alla distribuzione su dispositivi edge. L'articolo è disponibile su arXiv.
Fatti principali
- CLMT è un framework da 0,09 miliardi di parametri
- Mira alla sintesi cross-modale e cross-frequenza di segnali fisiologici
- Utilizza un paradigma di traduzione discreta a due stadi
- Il Tokenizer Universale impiega la Quantizzazione Vettoriale Residua Gerarchica (RVQ)
- Separa i segnali in varietà latenti discrete isolate
- Il Trasformatore Latente con Prompt Contestuale consente la generazione
- Punta a ridurre l'intreccio tra modalità e i costi computazionali
- Articolo disponibile su arXiv
Entità
Istituzioni
- arXiv