DiffScore: Un Nuovo Metodo di Valutazione del Testo che Utilizza Modelli Linguistici a Diffusione con Mascheramento

publication · 2026-05-13

Un nuovo articolo di ricerca presenta DiffScore, un framework per la valutazione del testo che impiega la ricostruzione mascherata insieme a grandi modelli linguistici a diffusione per affrontare il bias posizionale riscontrato nei modelli autoregressivi. Questo approccio valuta ogni token utilizzando un contesto bidirezionale completo, eliminando così lo squilibrio di fattorizzazione da sinistra a destra. Crea una gerarchia per la valutazione che spazia dalla fluidità locale alla coerenza globale analizzando la recuperabilità del testo a vari tassi di mascheramento continui. Inoltre, DiffScore include strumenti diagnostici come profili di qualità multi-timestep e la decomposizione PMI bidirezionale, che distinguono la fluidità dalla fedeltà. Esperimenti condotti su dieci benchmark ne convalidano l'efficacia.

Fatti principali

DiffScore utilizza la ricostruzione mascherata invece della verosimiglianza autoregressiva
Elimina il bias posizionale utilizzando un contesto bidirezionale completo
Misura la recuperabilità del testo attraverso tassi di mascheramento continui
Fornisce profili di qualità multi-timestep e decomposizione PMI bidirezionale
Gli esperimenti sono stati condotti su dieci benchmark
L'articolo è pubblicato su arXiv con ID 2605.11601
Il metodo si basa su modelli linguistici a diffusione mascherati di grandi dimensioni
Valuta dalla fluidità locale alla coerenza globale

DiffScore: Un Nuovo Metodo di Valutazione del Testo che Utilizza Modelli Linguistici a Diffusione con Mascheramento

Fatti principali

Entità

Istituzioni

Fonti