DDIM allucina più di DDPM: analisi teorica della dinamica inversa
Uno studio recente pubblicato su arXiv nella categoria Computer Science > Machine Learning rivela che DDIM presenta un tasso di allucinazione più elevato rispetto a DDPM nei sampler di diffusione. La ricerca si concentra sull'equazione differenziale ordinaria inversa (ODE) di DDIM e sull'equazione differenziale stocastica (SDE) di DDPM applicate a un target di miscela gaussiana. Dopo un tempo critico τ, DDIM tende a rimanere bloccato tra due modi, mentre la stocasticità intrinseca di DDPM gli consente di uscire efficacemente da questo stato. I risultati suggeriscono che l'incorporazione di passi stocastici potrebbe migliorare le prestazioni di DDIM e mitigare le allucinazioni, offrendo preziose intuizioni per la progettazione futura di sampler.
Fatti principali
- DDIM allucina più di DDPM nei sampler di diffusione.
- Lo studio analizza l'ODE inversa (DDIM) e la SDE (DDPM) per un target di miscela gaussiana.
- Dopo il tempo critico τ, DDIM rimane bloccato sul segmento che collega i due modi più vicini.
- La stocasticità di DDPM lo aiuta a sbloccarsi, evitando l'allucinazione.
- La validazione empirica mostra che DDPM ha un tasso di allucinazione significativamente inferiore.
- Aggiungere passi stocastici può aiutare DDIM a evitare allucinazioni.
- L'articolo offre spunti per progettare sampler migliorati.
- Pubblicato su arXiv nella categoria Computer Science > Machine Learning.
Entità
Istituzioni
- arXiv