Flow Matching Senza Addestramento Aumenta la Diversità Senza Perdere Qualità

ai-technology · 2026-05-22

Un nuovo meccanismo di controllo durante l'inferenza, che non richiede addestramento, migliora significativamente la diversità nei modelli text-to-image basati su flow, mantenendo la qualità dell'immagine. Questo metodo promuove una diffusione laterale tra le traiettorie attraverso un obiettivo nello spazio delle feature e reintroduce l'incertezza con perturbazione stocastica programmata nel tempo. In particolare, questa perturbazione è proiettata ortogonalmente al flusso di generazione, un vincolo geometrico che aumenta la variazione senza compromettere i dettagli dell'immagine o l'accuratezza del prompt. Teoricamente, questo progetto aumenta costantemente una misura di volume, garantendo una maggiore diversità. Supera la sfida posta dalle traiettorie deterministiche nei modelli basati su flow, che possono rendere costosa l'esplorazione di modalità diverse con budget di campionamento limitati. Gli approcci esistenti tipicamente richiedono un riaddestramento o comportano una perdita di qualità. Questa ricerca, dettagliata in arXiv:2510.09060v2, presenta una soluzione efficace per aumentare la diversità nella generazione text-to-image.

Fatti principali

Meccanismo di controllo senza addestramento durante l'inferenza per modelli text-to-image basati su flow
Aumenta la diversità senza degradare la fedeltà dell'immagine
Incoraggia la diffusione laterale tra le traiettorie tramite obiettivo nello spazio delle feature
Reintroduce l'incertezza attraverso perturbazione stocastica programmata nel tempo
La perturbazione è proiettata ortogonalmente al flusso di generazione
Il vincolo geometrico preserva i dettagli dell'immagine e la fedeltà al prompt
Aumenta teoricamente in modo monotono una misura di volume
Affronta la limitazione delle traiettorie deterministiche nei modelli basati su flow

Flow Matching Senza Addestramento Aumenta la Diversità Senza Perdere Qualità

Fatti principali

Entità

Istituzioni

Fonti