OpenSTBench: Quadro di Valutazione Unificato per la Traduzione Vocale

ai-technology · 2026-06-01

Il nuovo quadro di valutazione, OpenSTBench, affronta il problema del confronto tra diversi sistemi di traduzione vocale. Questo campo comprende varie modalità, tra cui la traduzione da voce a testo (S2TT) e da voce a voce (S2ST), insieme a opzioni offline e in streaming, ciascuna delle quali produce output distinti in termini di modalità, tempistica e qualità del parlato. Le attuali tecniche di valutazione analizzano la qualità della traduzione, la qualità del parlato e la qualità temporale in modo isolato, complicando i confronti completi. OpenSTBench consolida questi elementi in un formato unificato, accogliendo sia S2TT che S2ST in contesti offline e in streaming. Valuta collettivamente la qualità della traduzione, la qualità del parlato, la conservazione del parlante, la fedeltà emotiva e paralinguistica, la coerenza temporale e la latenza. Il quadro è descritto in un articolo disponibile su arXiv.

Fatti principali

OpenSTBench è un quadro di valutazione multidimensionale unificato per la traduzione vocale.
Supporta la traduzione da voce a testo (S2TT) e da voce a voce (S2ST).
Copre le impostazioni di generazione offline e in streaming.
Valuta congiuntamente qualità della traduzione, qualità del parlato, conservazione del parlante, fedeltà emotiva e paralinguistica, coerenza temporale e latenza.
Le pratiche di valutazione esistenti analizzano questi aspetti con protocolli separati.
Il quadro mira a consentire un confronto completo di sistemi eterogenei.
L'articolo è disponibile su arXiv con ID 2605.30792.
Il tipo di annuncio è cross.

OpenSTBench: Quadro di Valutazione Unificato per la Traduzione Vocale

Fatti principali

Entità

Istituzioni

Fonti