ARTFEED — Contemporary Art Intelligence

VAGS: Scala di Guida Adattiva alla Velocità per il Editing e la Generazione di Immagini

ai-technology · 2026-05-18

Un approccio innovativo noto come Velocity-Adaptive Guidance Scale (VAGS) migliora la guida senza classificatore nei modelli di diffusione modificando flessibilmente la forza della guida lungo la traiettoria ODE. A differenza del CFG tradizionale, che utilizza una scala costante, VAGS regola la scala nominale con un fattore limitato che incorpora una componente temporale a livello di segnale insieme alla similarità del coseno tra i campi di velocità pertinenti al compito. Per l'editing senza inversione, VAGS valuta l'allineamento tra le velocità guidate dalla sorgente e dal target, consentendo una forza di editing adattiva basata sulla compatibilità locale. Questa tecnica risolve i problemi in cui i passaggi iniziali sono dominati dal rumore mentre quelli successivi solidificano la struttura dell'immagine. VAGS è proposto come alternativa alle scale di guida fisse nei sampler basati su flusso. I risultati sono dettagliati nell'articolo arXiv 2605.15661.

Fatti principali

  • VAGS è un sostituto senza addestramento per la guida senza classificatore.
  • Moltiplica la scala nominale per un fattore limitato che combina un termine temporale a livello di segnale e la similarità del coseno.
  • Il CFG standard utilizza una scala fissa lungo l'intera traiettoria ODE.
  • I passaggi iniziali sono dominati dal rumore con un debole segnale semantico.
  • I passaggi finali consolidano la struttura dell'immagine e richiedono un impegno direzionale più forte.
  • VAGS misura l'allineamento tra le velocità guidate dalla sorgente e dal target per l'editing senza inversione.
  • La forza di editing in ogni passaggio riflette la compatibilità locale tra i campi di velocità.
  • L'articolo è disponibile su arXiv con ID 2605.15661.

Entità

Istituzioni

  • arXiv

Fonti