Un framework di data augmentation migliora la valutazione del linguaggio disartrico

other · 2026-05-04

I ricercatori propongono un framework a tre fasi per la valutazione della qualità del linguaggio disartrico (DSQA) che utilizza linguaggio disartrico non etichettato e ampi dataset di linguaggio tipico. Un modello insegnante genera pseudo-etichette, seguito da un pre-addestramento debolmente supervisionato con apprendimento contrastivo basato sulle etichette, quindi un fine-tuning per DSQA. Esperimenti su cinque dataset non visti mostrano robustezza, con una baseline basata su Whisper che supera i predittori SOTA come SpICE.

Fatti principali

Il framework utilizza linguaggio disartrico non etichettato e dataset di linguaggio tipico
Un modello insegnante genera pseudo-etichette per campioni non etichettati
Il pre-addestramento debolmente supervisionato utilizza apprendimento contrastivo basato sulle etichette
Fine-tuning per il compito DSQA a valle
Testato su cinque dataset non visti attraverso molteplici eziologie e lingue
La baseline basata su Whisper supera SpICE e altri predittori SOTA

Entità

—

Fonti

arXiv cs.AI — 2026-05-04