Sondaggio dello Spazio Latente per il Rilevamento di Contenuti per Adulti nei Modelli Generativi Video

ai-technology · 2026-05-06

I ricercatori propongono un nuovo framework per rilevare contenuti per adulti in video generati dall'IA intercettando le rappresentazioni latenti durante il processo di generazione. Il metodo collega classificatori leggeri al modello di diffusione video CogVideoX, analizzando le rappresentazioni latenti denoised in tempo reale. È stato costruito un dataset di 11.039 clip video di dieci secondi (5.086 violanti, 5.953 non violanti) da siti web per adulti e YouTube. Sono state introdotte e valutate due architetture di classificatori di probing. Questo approccio affronta i limiti dei metodi esistenti che operano solo su prompt o output decodificati a livello di pixel, i quali perdono le rappresentazioni interne.

Fatti principali

Il framework intercetta le rappresentazioni latenti dal modello di diffusione video CogVideoX.
Classificatori leggeri sono collegati per il rilevamento in tempo reale di contenuti per adulti.
Dataset di 11.039 clip di dieci secondi: 5.086 violanti, 5.953 non violanti.
Clip provenienti da siti web per adulti e YouTube.
Introdotte due architetture di classificatori di probing.
Affronta la cecità dei metodi esistenti verso le rappresentazioni interne.
Pubblicato su arXiv con ID 2605.00874.
Il metodo proposto opera durante l'inferenza.

Sondaggio dello Spazio Latente per il Rilevamento di Contenuti per Adulti nei Modelli Generativi Video

Fatti principali

Entità

Istituzioni

Fonti