Nuovo Benchmark SH-Bench Valuta i Rischi per la Privacy dei Passanti nei Modelli Linguistici Audio in Ambienti Multi-Parlante
I modelli linguistici di grandi dimensioni audio impiegati in contesti reali catturano frequentemente discorsi involontari di passanti, creando vulnerabilità significative per la privacy che gli attuali benchmark e difese non riescono a risolvere. I ricercatori hanno sviluppato SH-Bench, il primo benchmark specificamente progettato per valutare le capacità di ascolto selettivo in questi modelli. Questo benchmark contiene 3.968 miscele audio multi-parlante che combinano scenari sia reali che sintetici, accompagnate da 77.000 domande a scelta multipla che testano i modelli in modalità operative generali e selettive. È stata introdotta una nuova metrica chiamata Efficacia Selettiva (SE) per misurare simultaneamente sia la comprensione multi-parlante che la protezione della privacy dei passanti. Le valutazioni dei modelli linguistici all'avanguardia open-source e proprietari dimostrano una sostanziale perdita di privacy dai discorsi dei passanti. Il documento di ricerca, identificato come arXiv:2512.06380v3 con Announce Type replace-cross, evidenzia come i sistemi esistenti proteggano inadeguatamente il parlato incidentale catturato durante il normale funzionamento. Questo lavoro rappresenta il primo approccio sistematico per quantificare e affrontare i rischi per la privacy nei modelli linguistici audio quando sono presenti più parlanti. Il design completo del benchmark include scenari audio diversificati per testare a fondo il comportamento del modello in ambienti uditivi complessi.
Fatti principali
- I modelli linguistici audio catturano discorsi involontari di passanti nelle implementazioni reali
- SH-Bench è il primo benchmark per valutare l'ascolto selettivo nei modelli linguistici audio
- Il benchmark contiene 3.968 miscele audio multi-parlante
- Include 77.000 domande a scelta multipla che testano modalità generali e selettive
- Introduce la metrica Efficacia Selettiva (SE) per comprensione e privacy
- Le valutazioni mostrano una sostanziale perdita di privacy dei passanti nei modelli attuali
- Identificatore del documento: arXiv:2512.06380v3 con Announce Type replace-cross
- Il benchmark include sia scenari audio reali che sintetici
Entità
—