SQuTR Testa il Recupero di Query Parlate in Presenza di Rumore

other · 2026-05-07

I ricercatori hanno introdotto SQuTR, un benchmark di robustezza per sistemi di recupero di testo da query parlate. Il benchmark include un dataset su larga scala di 37.317 query uniche provenienti da sei dataset di recupero testo in inglese e cinese, coprendo molteplici domini. Il parlato è sintetizzato da 200 parlanti reali e 17 categorie di rumore ambientale del mondo reale vengono mescolate a livelli SNR controllati. Ciò consente una valutazione riproducibile in condizioni che vanno dal silenzio a condizioni molto rumorose. Il lavoro mira a superare le limitazioni dei dataset di valutazione esistenti, spesso limitati a query semplici in condizioni di rumore vincolate.

Fatti principali

SQuTR è un benchmark di robustezza per il recupero di query parlate.
Il dataset aggrega 37.317 query uniche.
Le query provengono da sei dataset di recupero testo in inglese e cinese.
Il parlato è sintetizzato utilizzando profili vocali di 200 parlanti reali.
Vengono utilizzate 17 categorie di rumore ambientale del mondo reale.
Il rumore viene mescolato a livelli SNR controllati.
Il benchmark consente una valutazione riproducibile della robustezza.
I dataset esistenti sono limitati a query semplici in condizioni di rumore vincolate.

Entità

—

Fonti

arXiv cs.AI — 2026-05-07