ARTFEED — Contemporary Art Intelligence

VIPaint: Inferenza Variazionale per l'Inpainting di Immagini Basato su Diffusione

ai-technology · 2026-05-01

I ricercatori propongono VIPaint, un algoritmo di inferenza variazionale gerarchica per l'inpainting di immagini utilizzando modelli di diffusione pre-addestrati. Il metodo ottimizza un'approssimazione di Markov non gaussiana del vero posteriore di diffusione, consentendo imputazioni diverse e di alta qualità anche per regioni mascherate di grandi dimensioni. VIPaint supera le baseline esistenti ed è applicabile a modelli di diffusione latente, che generano immagini di alta qualità con un costo computazionale inferiore. L'approccio funziona con modelli di diffusione latente condizionati da testo all'avanguardia, affrontando le limitazioni dei metodi precedenti che non riescono a produrre campioni dalla vera distribuzione condizionata.

Fatti principali

  • VIPaint utilizza l'inferenza variazionale gerarchica per l'inpainting basato su diffusione.
  • Ottimizza un'approssimazione di Markov non gaussiana del posteriore di diffusione.
  • Il metodo funziona con modelli di diffusione latente per una generazione efficiente e di alta qualità.
  • Gestisce regioni mascherate di grandi dimensioni meglio delle baseline esistenti.
  • VIPaint è efficace per modelli di diffusione latente condizionati da testo.
  • L'approccio produce imputazioni diverse.
  • Affronta la sfida di condizionare processi generativi su immagini corrotte.
  • La ricerca è pubblicata su arXiv (2411.18929).

Entità

Istituzioni

  • arXiv

Fonti