ARTFEED — Contemporary Art Intelligence

Un framework di data augmentation migliora la valutazione del linguaggio disartrico

other · 2026-05-04

I ricercatori propongono un framework a tre fasi per la valutazione della qualità del linguaggio disartrico (DSQA) che utilizza linguaggio disartrico non etichettato e ampi dataset di linguaggio tipico. Un modello insegnante genera pseudo-etichette, seguito da un pre-addestramento debolmente supervisionato con apprendimento contrastivo basato sulle etichette, quindi un fine-tuning per DSQA. Esperimenti su cinque dataset non visti mostrano robustezza, con una baseline basata su Whisper che supera i predittori SOTA come SpICE.

Fatti principali

  • Il framework utilizza linguaggio disartrico non etichettato e dataset di linguaggio tipico
  • Un modello insegnante genera pseudo-etichette per campioni non etichettati
  • Il pre-addestramento debolmente supervisionato utilizza apprendimento contrastivo basato sulle etichette
  • Fine-tuning per il compito DSQA a valle
  • Testato su cinque dataset non visti attraverso molteplici eziologie e lingue
  • La baseline basata su Whisper supera SpICE e altri predittori SOTA

Entità

Fonti