DDIM allucina più di DDPM: analisi teorica della dinamica inversa

ai-technology · 2026-05-11

Uno studio recente pubblicato su arXiv nella categoria Computer Science > Machine Learning rivela che DDIM presenta un tasso di allucinazione più elevato rispetto a DDPM nei sampler di diffusione. La ricerca si concentra sull'equazione differenziale ordinaria inversa (ODE) di DDIM e sull'equazione differenziale stocastica (SDE) di DDPM applicate a un target di miscela gaussiana. Dopo un tempo critico τ, DDIM tende a rimanere bloccato tra due modi, mentre la stocasticità intrinseca di DDPM gli consente di uscire efficacemente da questo stato. I risultati suggeriscono che l'incorporazione di passi stocastici potrebbe migliorare le prestazioni di DDIM e mitigare le allucinazioni, offrendo preziose intuizioni per la progettazione futura di sampler.

Fatti principali

DDIM allucina più di DDPM nei sampler di diffusione.
Lo studio analizza l'ODE inversa (DDIM) e la SDE (DDPM) per un target di miscela gaussiana.
Dopo il tempo critico τ, DDIM rimane bloccato sul segmento che collega i due modi più vicini.
La stocasticità di DDPM lo aiuta a sbloccarsi, evitando l'allucinazione.
La validazione empirica mostra che DDPM ha un tasso di allucinazione significativamente inferiore.
Aggiungere passi stocastici può aiutare DDIM a evitare allucinazioni.
L'articolo offre spunti per progettare sampler migliorati.
Pubblicato su arXiv nella categoria Computer Science > Machine Learning.

DDIM allucina più di DDPM: analisi teorica della dinamica inversa

Fatti principali

Entità

Istituzioni

Fonti