Nuovo Metodo Rileva Allucinazioni nei Modelli Linguistici di Grande Dimensione per il Parlato Utilizzando Metriche di Attenzione

ai-technology · 2026-04-22

Uno studio recente presenta una tecnica innovativa per identificare le allucinazioni nei Modelli Linguistici di Grande Dimensione per il Parlato (SpeechLLMs) durante l'inferenza, esaminando i pattern di attenzione. Questo metodo impiega quattro metriche derivate dall'attenzione—AUDIORATIO, AUDIOCONSISTENCY, AUDIOENTROPY e TEXTENTROPY—per individuare l'attenzione patologica associata alle allucinazioni. Utilizzando classificatori leggeri di regressione logistica addestrati su queste metriche, il processo di rilevamento diventa efficiente senza la necessità di costosi output di riferimento. I test condotti sui modelli Qwen-2-Audio e Voxtral-3B in compiti di riconoscimento vocale automatico e traduzione da parlato a testo dimostrano che questa tecnica supera sia i benchmark basati sull'incertezza che quelli precedenti basati sull'attenzione sui dati in dominio, ottenendo miglioramenti fino a +0,23 PR-AUC. Generalizza efficacemente anche a contesti ASR fuori dominio, affrontando un problema critico negli SpeechLLMs dove i segnali specifici dell'audio sfuggono al rilevamento da parte dei metodi basati sul testo per LLM. Questa ricerca è disponibile su arXiv con identificatore arXiv:2604.19565v1, classificata come annuncio incrociato, sottolineando il suo utilizzo pratico per il rilevamento in tempo reale delle allucinazioni nei modelli vocali.

Fatti principali

Le allucinazioni nei Modelli Linguistici di Grande Dimensione per il Parlato comportano rischi significativi
I metodi di rilevamento esistenti spesso si basano su costosi output di riferimento
I metodi di rilevamento delle allucinazioni per LLM basati sul testo non catturano i segnali specifici dell'audio
Sono state investigate quattro metriche derivate dall'attenzione: AUDIORATIO, AUDIOCONSISTENCY, AUDIOENTROPY, TEXTENTROPY
Classificatori leggeri di regressione logistica sono stati addestrati su queste caratteristiche per il rilevamento al momento dell'inferenza
Le valutazioni hanno utilizzato i modelli Qwen-2-Audio e Voxtral-3B
Il metodo ha superato i benchmark basati sull'incertezza e quelli precedenti basati sull'attenzione sui dati in dominio
Ha ottenuto miglioramenti fino a +0,23 PR-AUC e ha generalizzato a contesti ASR fuori dominio

Nuovo Metodo Rileva Allucinazioni nei Modelli Linguistici di Grande Dimensione per il Parlato Utilizzando Metriche di Attenzione

Fatti principali

Entità

Istituzioni

Fonti