Framework MP-IB per il Rilevamento dell'Agitazione Bipolare tramite Biomarcatori Vocali
Un team di ricercatori ha presentato MP-IB, il primo framework che affronta la quantizzazione a precisione mista come un collo di bottiglia informativo per distinguere tratto clinico e stato nel rilevamento dell'agitazione nel disturbo bipolare attraverso biomarcatori vocali. Questo framework impiega una testa di tratto FP16 (1.024 bit) per identificare i parlanti e una testa di stato INT4 (128 bit) per valutare l'agitazione, ottenendo un'asimmetria informativa di 8x senza necessità di addestramento avversario. Include Dynamic Precision Scheduling e Multi-Scale Temporal Fusion. Nei test sul dataset Bridge2AI-Voice (N=833, 4 sessioni per partecipante, validazione incrociata rigorosa indipendente dal parlante), MP-IB ha registrato un rho di 0,117 (IC 95%: [0,089, 0,145], p=0,003 vs. casuale), superando un WavLM-Adapter da 94M di parametri con continuazione dell'apprendimento auto-supervisionato nel dominio (rho = -0,042) e il beta VAE (rho = 0,089). Questo framework è progettato per dispositivi edge con risorse limitate, facilitando il monitoraggio continuo dell'agitazione nel disturbo bipolare tramite analisi vocale.
Fatti principali
- MP-IB è il primo framework a trattare la quantizzazione a precisione mista come un collo di bottiglia informativo per la separazione tratto-stato clinico.
- La testa di tratto FP16 utilizza 1.024 bit per l'identità del parlante; la testa di stato INT4 utilizza 128 bit per l'agitazione.
- Asimmetria informativa di 8x ottenuta senza addestramento avversario.
- Include Dynamic Precision Scheduling e Multi-Scale Temporal Fusion.
- Valutato sul dataset Bridge2AI-Voice con N=833, 4 sessioni per partecipante.
- Raggiunto rho = 0,117 (IC 95%: [0,089, 0,145], p=0,003 vs. casuale).
- Superato WavLM-Adapter da 94M di parametri (rho = -0,042) e beta VAE (rho = 0,089).
- Progettato per il monitoraggio continuo su dispositivo dell'agitazione nel disturbo bipolare.
Entità
Istituzioni
- arXiv