DFBScanner: Rilevamento Rapido di Backdoor nelle DNN tramite Ispezione dei Parametri
I ricercatori propongono DFBScanner, un framework leggero per rilevare attacchi backdoor nelle reti neurali profonde. A differenza dei metodi esistenti che si basano sull'analisi dell'attivazione o sull'ingegneria inversa dei trigger—spesso richiedendo campioni puliti o conoscenze pregresse—DFBScanner ispeziona i parametri statici nell'ultimo strato di classificazione. L'intuizione chiave è che le perturbazioni delle feature indotte dalla backdoor causano aggiornamenti dei parametri distintivi. Questo approccio riduce drasticamente il tempo di rilevamento da minuti o ore a millisecondi, eguagliando la velocità degli attacchi avanzati. Il framework è progettato per essere pratico e generalizzabile, affrontando le limitazioni delle difese attuali.
Fatti principali
- 1. DFBScanner è un framework leggero di ispezione dei parametri statici.
- 2. Rileva attacchi backdoor analizzando gli aggiornamenti dei parametri nell'ultimo strato di classificazione.
- 3. Le difese esistenti sono lente, impiegando minuti o ore, mentre gli attacchi si impiantano in millisecondi.
- 4. DFBScanner mira a eguagliare la velocità degli attacchi con rilevamento a livello di millisecondi.
- 5. Il metodo non richiede campioni puliti né conoscenze pregresse dei pattern dei trigger.
- 6. Sposta l'attenzione dal riconoscimento di pattern specifici di trigger all'identificazione di effetti backdoor unificati.
- 7. Il framework è progettato per una maggiore efficacia, praticità e generalizzabilità.
- 8. La ricerca è pubblicata su arXiv con ID 2605.18907.
Entità
Istituzioni
- arXiv