Punti ciechi del machine unlearning: attacchi di over-unlearning e relearning
Un nuovo articolo su arXiv (2506.01318) identifica due punti ciechi critici nel machine unlearning (MU): l'over-unlearning, che degrada i dati conservati vicini al set dimenticato, e gli attacchi di relearning prototipici che possono resuscitare conoscenze dimenticate con pochi campioni. Gli autori propongono una metrica OU@epsilon per quantificare i danni collaterali e introducono Spotter, un obiettivo plug-and-play che combina una penalità di knowledge-distillation mascherata per contrastare entrambi i problemi nell'unlearning a livello di classe.
Fatti principali
- 1. L'articolo arXiv:2506.01318 affronta l'over-unlearning e gli attacchi di relearning nel machine unlearning.
- 2. L'over-unlearning deteriora i dati conservati vicini al set dimenticato.
- 3. L'attacco di relearning prototipico sfrutta i prototipi per classe per ripristinare le prestazioni precedenti all'unlearning.
- 4. La metrica OU@epsilon quantifica l'over-unlearning nelle regioni prossime al set dimenticato.
- 5. Spotter è un obiettivo plug-and-play con una penalità di knowledge-distillation mascherata.
- 6. L'attenzione è sull'unlearning a livello di classe.
- 7. L'articolo è stato annunciato come replace-cross su arXiv.
- 8. L'attacco richiede solo pochi campioni della classe dimenticata.
Entità
Istituzioni
- arXiv