Un framework di data augmentation migliora la valutazione del linguaggio disartrico
I ricercatori propongono un framework a tre fasi per la valutazione della qualità del linguaggio disartrico (DSQA) che utilizza linguaggio disartrico non etichettato e ampi dataset di linguaggio tipico. Un modello insegnante genera pseudo-etichette, seguito da un pre-addestramento debolmente supervisionato con apprendimento contrastivo basato sulle etichette, quindi un fine-tuning per DSQA. Esperimenti su cinque dataset non visti mostrano robustezza, con una baseline basata su Whisper che supera i predittori SOTA come SpICE.
Fatti principali
- Il framework utilizza linguaggio disartrico non etichettato e dataset di linguaggio tipico
- Un modello insegnante genera pseudo-etichette per campioni non etichettati
- Il pre-addestramento debolmente supervisionato utilizza apprendimento contrastivo basato sulle etichette
- Fine-tuning per il compito DSQA a valle
- Testato su cinque dataset non visti attraverso molteplici eziologie e lingue
- La baseline basata su Whisper supera SpICE e altri predittori SOTA
Entità
—