I modelli di diffusione basati su score apprendono provabilmente distribuzioni di dati a bassa dimensionalità
Un recente studio teorico dimostra che i modelli di diffusione basati su score possono catturare efficacemente distribuzioni di dati caratterizzate da strutture intrinsecamente a bassa dimensionalità, come quelle presenti nelle immagini naturali, utilizzando campioni limitati. Questa ricerca stabilisce limiti di errore per campioni finiti nella distanza di Wasserstein-p per ogni p ≥ 1, basandosi esclusivamente su ipotesi di momenti finiti per la distribuzione target μ, senza necessità di condizioni come supporto compatto, varietà o densità liscia. Quando vengono forniti n campioni i.i.d. da μ con un q-esimo momento finito, il tasso di convergenza è polinomialmente correlato alla dimensione intrinseca anziché alla dimensione ambiente, chiarendo perché i modelli di diffusione funzionano bene su dati ad alta dimensionalità ma a bassa complessità come le immagini. Questi risultati sono validi sotto condizioni di regolarità lievi riguardanti il processo di diffusione in avanti e la distribuzione dei dati, offrendo le prime garanzie statistiche che tengono conto della struttura intrinsecamente a bassa dimensionalità prevalente nei dataset del mondo reale.
Fatti principali
- arXiv:2603.03700v2
- Modelli di diffusione basati su score
- Limiti di errore per campioni finiti nella distanza di Wasserstein-p
- Tutti p ≥ 1
- Ipotesi di momenti finiti su μ
- Nessuna condizione di supporto compatto, varietà o densità liscia
- Il tasso di convergenza dipende dalla dimensione intrinseca
- Condizioni di regolarità lievi sulla diffusione in avanti e sulla distribuzione dei dati
Entità
Istituzioni
- arXiv