ARTFEED — Contemporary Art Intelligence

S2ST-Omni 2: Condizionamento Linguistico Strutturato per la Traduzione Multilingue del Parlato

ai-technology · 2026-05-18

I ricercatori propongono S2ST-Omni 2, un framework compositivo many-to-one per la traduzione da parlato a parlato (S2ST) che sostituisce le etichette linguistiche piatte con priori tipologici strutturati. Questa riformulazione affronta il limite dei sistemi S2ST esistenti che trascurano le informazioni della lingua sorgente o le codificano come embedding indipendenti piatti, trascurando le strutture linguistiche sistematiche condivise tra le lingue. L'approccio opera a tre livelli: codifica linguistica gerarchica basata sulla tipologia, adattamento linguistico con gating dinamico e condizionamento strutturato per l'adattamento multilingue. Il framework mira a migliorare l'adattamento multilingue efficiente in termini di dati quando i dati S2ST supervisionati sono scarsi. Il lavoro è pubblicato su arXiv con identificatore 2605.16026.

Fatti principali

  • S2ST-Omni 2 è un framework compositivo many-to-one per S2ST.
  • Sostituisce le etichette linguistiche piatte con priori tipologici strutturati.
  • I sistemi S2ST esistenti spesso trascurano le informazioni della lingua sorgente o usano embedding piatti.
  • L'approccio opera a tre livelli: codifica gerarchica, gating dinamico e condizionamento strutturato.
  • Mira a migliorare l'adattamento multilingue efficiente in termini di dati con dati supervisionati scarsi.
  • Pubblicato su arXiv con identificatore 2605.16026.
  • Affronta le limitazioni degli attuali sistemi S2ST basati su SpeechLLM.
  • Propone un condizionamento linguistico strutturato per la traduzione multilingue del parlato.

Entità

Istituzioni

  • arXiv

Fonti