DiLaDiff: Modello di Diffusione Latente Distillato per la Modellazione del Linguaggio

ai-technology · 2026-05-25

I ricercatori hanno introdotto DiLaDiff, una nuova variante dei modelli linguistici a diffusione mascherata che affronta il bilanciamento tra qualità del campionamento e throughput creando uno spazio latente continuo con funzioni semantiche. Questo modello è composto da tre elementi chiave: un auto-encoder messo a punto a partire da un modello linguistico a diffusione mascherata preesistente, un modello di diffusione latente che apprende il prior della distribuzione dell'encoder, e un modello di consistenza che distilla questo prior appreso in un modello generativo latente semplificato. I risultati indicano che il modello di diffusione guidato dal latente supera il baseline di diffusione mascherata in termini di prestazioni, accelerando anche l'inferenza. Inoltre, la distillazione per consistenza riduce significativamente i costi computazionali, rendendo la generazione latente quasi banale rispetto alla decodifica discreta.

Fatti principali

DiLaDiff è una variante dei modelli linguistici a diffusione mascherata.
Introduce uno spazio latente continuo con capacità semantiche.
L'auto-encoder è messo a punto a partire da un modello linguistico a diffusione mascherata esistente.
Un modello di diffusione latente apprende il prior sulla distribuzione dell'encoder.
Un modello di consistenza distilla il prior appreso in un modello generativo latente a pochi passi.
Senza distillazione, il modello supera il baseline di diffusione mascherata.
L'inferenza è significativamente accelerata.
La distillazione per consistenza riduce il sovraccarico computazionale.

Entità

—

Fonti

arXiv cs.AI — 2026-05-25