Flow Matching Senza Addestramento Aumenta la Diversità Senza Perdere Qualità
Un nuovo meccanismo di controllo durante l'inferenza, che non richiede addestramento, migliora significativamente la diversità nei modelli text-to-image basati su flow, mantenendo la qualità dell'immagine. Questo metodo promuove una diffusione laterale tra le traiettorie attraverso un obiettivo nello spazio delle feature e reintroduce l'incertezza con perturbazione stocastica programmata nel tempo. In particolare, questa perturbazione è proiettata ortogonalmente al flusso di generazione, un vincolo geometrico che aumenta la variazione senza compromettere i dettagli dell'immagine o l'accuratezza del prompt. Teoricamente, questo progetto aumenta costantemente una misura di volume, garantendo una maggiore diversità. Supera la sfida posta dalle traiettorie deterministiche nei modelli basati su flow, che possono rendere costosa l'esplorazione di modalità diverse con budget di campionamento limitati. Gli approcci esistenti tipicamente richiedono un riaddestramento o comportano una perdita di qualità. Questa ricerca, dettagliata in arXiv:2510.09060v2, presenta una soluzione efficace per aumentare la diversità nella generazione text-to-image.
Fatti principali
- Meccanismo di controllo senza addestramento durante l'inferenza per modelli text-to-image basati su flow
- Aumenta la diversità senza degradare la fedeltà dell'immagine
- Incoraggia la diffusione laterale tra le traiettorie tramite obiettivo nello spazio delle feature
- Reintroduce l'incertezza attraverso perturbazione stocastica programmata nel tempo
- La perturbazione è proiettata ortogonalmente al flusso di generazione
- Il vincolo geometrico preserva i dettagli dell'immagine e la fedeltà al prompt
- Aumenta teoricamente in modo monotono una misura di volume
- Affronta la limitazione delle traiettorie deterministiche nei modelli basati su flow
Entità
Istituzioni
- arXiv