ARTFEED — Contemporary Art Intelligence

OpenVTON-Bench: Benchmark da 100K ad alta risoluzione per la valutazione del virtual try-on

ai-technology · 2026-05-07

OpenVTON-Bench è stato introdotto come un benchmark completo per la valutazione del virtual try-on, comprendente circa 100.000 coppie di immagini ad alta risoluzione, ciascuna fino a 1536x1536 pixel. Utilizzando il clustering gerarchico basato su DINOv3 per il campionamento, il dataset raggiunge una distribuzione uniforme su 20 categorie di capi di abbigliamento grazie alla didascalia densa basata su Gemini. Il protocollo di valutazione valuta cinque dimensioni critiche, tra cui la coerenza dello sfondo e il realismo complessivo, affrontando le carenze delle metriche tradizionali nel catturare i dettagli della texture e la coerenza semantica. Questa iniziativa mira ad allinearsi agli standard commerciali per scala e diversità ed è stata pubblicata su arXiv con l'identificatore 2601.22725.

Fatti principali

  • OpenVTON-Bench include circa 100K coppie di immagini ad alta risoluzione.
  • Le immagini sono fino a 1536x1536 pixel.
  • Il dataset utilizza il clustering gerarchico basato su DINOv3 per il campionamento.
  • La didascalia densa basata su Gemini garantisce una distribuzione uniforme su 20 categorie di capi.
  • Il protocollo di valutazione misura cinque dimensioni: coerenza dello sfondo, fedeltà dell'identità, fedeltà della texture, plausibilità della forma, realismo complessivo.
  • Affronta le limitazioni delle metriche tradizionali nel quantificare i dettagli della texture e la coerenza semantica.
  • Mira a soddisfare gli standard commerciali in termini di scala e diversità.
  • Pubblicato su arXiv (2601.22725).

Entità

Istituzioni

  • arXiv

Fonti