I modelli di diffusione basati su score apprendono provabilmente distribuzioni di dati a bassa dimensionalità

publication · 2026-04-25

Un recente studio teorico dimostra che i modelli di diffusione basati su score possono catturare efficacemente distribuzioni di dati caratterizzate da strutture intrinsecamente a bassa dimensionalità, come quelle presenti nelle immagini naturali, utilizzando campioni limitati. Questa ricerca stabilisce limiti di errore per campioni finiti nella distanza di Wasserstein-p per ogni p ≥ 1, basandosi esclusivamente su ipotesi di momenti finiti per la distribuzione target μ, senza necessità di condizioni come supporto compatto, varietà o densità liscia. Quando vengono forniti n campioni i.i.d. da μ con un q-esimo momento finito, il tasso di convergenza è polinomialmente correlato alla dimensione intrinseca anziché alla dimensione ambiente, chiarendo perché i modelli di diffusione funzionano bene su dati ad alta dimensionalità ma a bassa complessità come le immagini. Questi risultati sono validi sotto condizioni di regolarità lievi riguardanti il processo di diffusione in avanti e la distribuzione dei dati, offrendo le prime garanzie statistiche che tengono conto della struttura intrinsecamente a bassa dimensionalità prevalente nei dataset del mondo reale.

Fatti principali

arXiv:2603.03700v2
Modelli di diffusione basati su score
Limiti di errore per campioni finiti nella distanza di Wasserstein-p
Tutti p ≥ 1
Ipotesi di momenti finiti su μ
Nessuna condizione di supporto compatto, varietà o densità liscia
Il tasso di convergenza dipende dalla dimensione intrinseca
Condizioni di regolarità lievi sulla diffusione in avanti e sulla distribuzione dei dati

I modelli di diffusione basati su score apprendono provabilmente distribuzioni di dati a bassa dimensionalità

Fatti principali

Entità

Istituzioni

Fonti