CoVUBench: Nuovo Benchmark per l'Unlearning del Copyright nei LVLM

ai-technology · 2026-05-07

CoVUBench è stato lanciato da ricercatori come il primo benchmark volto a valutare l'unlearning di contenuti protetti da copyright nei Large Vision-Language Models (LVLM). Questi modelli, addestrati su vasti dati web, possono inavvertitamente memorizzare e riprodurre elementi visivi protetti da copyright come loghi e personaggi. Sebbene il machine unlearning rappresenti un metodo valido per eliminare contenuti specifici dopo l'addestramento, valutarne il successo in contesti multimodali presenta difficoltà. CoVUBench colma questa lacuna utilizzando dati sintetici generati proceduralmente e legalmente conformi, che incorporano variazioni visive sistematiche, incluse alterazioni compositive e diverse rappresentazioni di dominio, per valutare efficacemente la generalizzazione dell'unlearning. Questo benchmark mira a fornire una valutazione approfondita e realistica della capacità dei LVLM di dimenticare contenuti protetti da copyright, preservando al contempo le loro prestazioni.

Fatti principali

CoVUBench è il primo benchmark per valutare l'unlearning del copyright nei LVLM.
I LVLM possono memorizzare e rigenerare contenuti visivi protetti da copyright come personaggi e loghi.
Il machine unlearning rimuove contenuti specifici dopo l'addestramento.
Gli attuali metodi di valutazione mancano di robustezza per contesti multimodali.
CoVUBench utilizza dati sintetici generati proceduralmente.
I dati includono variazioni visive sistematiche come cambiamenti compositivi.
Il benchmark valuta la generalizzazione dell'unlearning attraverso diverse manifestazioni di dominio.
I dati sintetici sono legalmente sicuri.

Entità

—

Fonti

arXiv cs.AI — 2026-05-06