DBMSolver: Campionatore di Ponti di Diffusione Senza Addestramento Accelera la Traduzione I2I
I ricercatori introducono DBMSolver, un campionatore senza addestramento che accelera la traduzione immagine-immagine (I2I) basata su diffusione sfruttando la struttura semi-lineare dei Modelli a Ponte di Diffusione (DBM). Utilizzando integratori esponenziali per soluzioni del 1° e 2° ordine, DBMSolver riduce il numero di valutazioni di funzione (NFE) fino a 5 volte migliorando al contempo la qualità dell'output—ad esempio, l'FID diminuisce del 53% su DIODE a 20 NFE rispetto a una baseline del 2° ordine. Il metodo raggiunge compromessi efficienza-qualità all'avanguardia su compiti come inpainting, stilizzazione e generazione da semantica a immagine a risoluzioni fino a 256x256. Il codice è disponibile pubblicamente su GitHub.
Fatti principali
- DBMSolver è un campionatore senza addestramento per Modelli a Ponte di Diffusione.
- Sfrutta la struttura semi-lineare dei DBM tramite integratori esponenziali.
- Riduce le NFE fino a 5 volte rispetto ai metodi esistenti.
- L'FID diminuisce del 53% su DIODE a 20 NFE rispetto alla baseline del 2° ordine.
- Testato su compiti di inpainting, stilizzazione e generazione da semantica a immagine.
- Supporta risoluzioni fino a 256x256.
- Il codice è disponibile pubblicamente su GitHub.
- Stabilisce nuovi compromessi efficienza-qualità all'avanguardia.
Entità
—