Autoguidance e Cura Online dei Dati per l'Addestramento di Modelli Diffusivi
Un recente articolo su arXiv (2509.15267) esplora il potenziale dell'autoguidance e delle tecniche di selezione online dei dati per migliorare l'efficienza e la velocità dell'addestramento dei modelli diffusivi generativi. I ricercatori hanno combinato la selezione congiunta di esempi (JEST) con l'autoguidance in un unico codice per facilitare studi di ablazione rapidi e benchmarking. Valutano varie strategie di cura dei dati utilizzando un compito controllato per la generazione di dati sintetici 2-D e la generazione di immagini (3x64x64)-D, garantendo tempi di esecuzione e numero di campioni uguali, considerando l'overhead di selezione. I risultati mostrano che l'autoguidance migliora significativamente la qualità e la diversità dei campioni. In particolare, l'AJEST precoce, che applica la selezione all'inizio dell'addestramento, può raggiungere un'efficienza dei dati comparabile o leggermente superiore, sebbene con un maggiore overhead temporale e complessità.
Fatti principali
- Titolo dell'articolo: Autoguided Online Data Curation for Diffusion Model Training
- ID arXiv: 2509.15267
- Tipo di annuncio: replace-cross
- Integra la selezione congiunta di esempi (JEST) e l'autoguidance
- Valutato su dati sintetici 2-D e generazione di immagini (3x64x64)-D
- Confronti a parità di tempo di esecuzione e numero di campioni
- L'autoguidance migliora costantemente la qualità e la diversità dei campioni
- L'AJEST precoce eguaglia o supera l'autoguidance da sola in efficienza dei dati
Entità
Istituzioni
- arXiv