SpInShield difende i rilevatori di deepfake dagli attacchi temporali
Una recente indagine indica che i rilevatori di deepfake video spaziotemporali, nonostante raggiungano punteggi AUC elevati, sono suscettibili ad attacchi di evasione. Questa vulnerabilità deriva dal loro eccessivo affidamento su delicati indizi spettrali temporali anziché su una forte causalità semantica. Per affrontare questo problema, i ricercatori hanno introdotto SpInShield, un framework di difesa che mantiene l'invarianza spettrale temporale separando il movimento semantico dagli artefatti spettrali facilmente manipolabili. Incorpora un avversario spettrale apprendibile per creare distorsioni spettrali significative e impiega una tecnica di ottimizzazione della soppressione delle scorciatoie per garantire che l'encoder catturi indicatori forensi affidabili eliminando statistiche spettrali inaffidabili. I test dimostrano che SpInShield ottiene risultati competitivi su dataset popolari, superando il baseline più forte di 21,30 punti percentuali in AUC quando affronta attacchi spettrali di ampiezza simulati.
Fatti principali
- I rilevatori di deepfake spaziotemporali sono suscettibili ad attacchi di evasione.
- I modelli si adattano eccessivamente a fragili indizi spettrali temporali.
- SpInShield è un framework di difesa a invarianza spettrale temporale.
- Separa il movimento semantico dagli artefatti spettrali.
- Un avversario spettrale apprendibile simula severe deformazioni spettrali.
- L'ottimizzazione della soppressione delle scorciatoie elimina le statistiche spettrali instabili.
- SpInShield supera il baseline più forte di 21,30 punti percentuali in AUC.
- Lo studio è pubblicato su arXiv (2605.07398).
Entità
Istituzioni
- arXiv