Nuovo Benchmark SH-Bench Valuta i Rischi per la Privacy dei Passanti nei Modelli Linguistici Audio in Ambienti Multi-Parlante

ai-technology · 2026-04-22

I modelli linguistici di grandi dimensioni audio impiegati in contesti reali catturano frequentemente discorsi involontari di passanti, creando vulnerabilità significative per la privacy che gli attuali benchmark e difese non riescono a risolvere. I ricercatori hanno sviluppato SH-Bench, il primo benchmark specificamente progettato per valutare le capacità di ascolto selettivo in questi modelli. Questo benchmark contiene 3.968 miscele audio multi-parlante che combinano scenari sia reali che sintetici, accompagnate da 77.000 domande a scelta multipla che testano i modelli in modalità operative generali e selettive. È stata introdotta una nuova metrica chiamata Efficacia Selettiva (SE) per misurare simultaneamente sia la comprensione multi-parlante che la protezione della privacy dei passanti. Le valutazioni dei modelli linguistici all'avanguardia open-source e proprietari dimostrano una sostanziale perdita di privacy dai discorsi dei passanti. Il documento di ricerca, identificato come arXiv:2512.06380v3 con Announce Type replace-cross, evidenzia come i sistemi esistenti proteggano inadeguatamente il parlato incidentale catturato durante il normale funzionamento. Questo lavoro rappresenta il primo approccio sistematico per quantificare e affrontare i rischi per la privacy nei modelli linguistici audio quando sono presenti più parlanti. Il design completo del benchmark include scenari audio diversificati per testare a fondo il comportamento del modello in ambienti uditivi complessi.

Fatti principali

I modelli linguistici audio catturano discorsi involontari di passanti nelle implementazioni reali
SH-Bench è il primo benchmark per valutare l'ascolto selettivo nei modelli linguistici audio
Il benchmark contiene 3.968 miscele audio multi-parlante
Include 77.000 domande a scelta multipla che testano modalità generali e selettive
Introduce la metrica Efficacia Selettiva (SE) per comprensione e privacy
Le valutazioni mostrano una sostanziale perdita di privacy dei passanti nei modelli attuali
Identificatore del documento: arXiv:2512.06380v3 con Announce Type replace-cross
Il benchmark include sia scenari audio reali che sintetici

Entità

—

Fonti

arXiv cs.AI — 2026-04-22