UniEditBench Introduce un Benchmark Unificato per la Valutazione dell'Editing di Immagini e Video

ai-technology · 2026-04-20

Un nuovo benchmark chiamato UniEditBench affronta i metodi di valutazione frammentati per i modelli di editing visivo. Gli attuali benchmark sono spesso adattati a paradigmi specifici, complicando i confronti equi tra paradigmi diversi. L'editing video attualmente manca di benchmark di valutazione affidabili. Le metriche automatiche comuni spesso non si allineano con le preferenze umane. L'utilizzo di grandi modelli multimodali come valutatori comporta costi computazionali e finanziari proibitivi. UniEditBench supporta sia metodi basati sulla ricostruzione che metodi guidati da istruzioni sotto un protocollo condiviso. Include una tassonomia strutturata che copre nove operazioni sulle immagini e otto operazioni sui video. Il benchmark gestisce compiti compositivi complessi come il conteggio e il riordinamento spaziale. Per consentire una valutazione scalabile, l'approccio distilla un MLLM ad alta capacità. Il lavoro è documentato nella preprint arXiv 2604.15871v1.

Fatti principali

UniEditBench è un benchmark unificato per la valutazione dell'editing di immagini e video
Gli attuali benchmark sono frammentati e adattati a paradigmi specifici
L'editing video manca di benchmark di valutazione affidabili
Le metriche automatiche comuni spesso non si allineano con le preferenze umane
L'utilizzo di grandi modelli multimodali come valutatori comporta costi computazionali e finanziari elevati
UniEditBench supporta metodi basati sulla ricostruzione e metodi guidati da istruzioni
Include una tassonomia di nove operazioni sulle immagini e otto operazioni sui video
Copre compiti compositivi complessi come il conteggio e il riordinamento spaziale

Entità

—

Fonti

arXiv cs.AI — 2026-04-20