Punti ciechi del machine unlearning: attacchi di over-unlearning e relearning

other · 2026-06-01

Un nuovo articolo su arXiv (2506.01318) identifica due punti ciechi critici nel machine unlearning (MU): l'over-unlearning, che degrada i dati conservati vicini al set dimenticato, e gli attacchi di relearning prototipici che possono resuscitare conoscenze dimenticate con pochi campioni. Gli autori propongono una metrica OU@epsilon per quantificare i danni collaterali e introducono Spotter, un obiettivo plug-and-play che combina una penalità di knowledge-distillation mascherata per contrastare entrambi i problemi nell'unlearning a livello di classe.

Fatti principali

1. L'articolo arXiv:2506.01318 affronta l'over-unlearning e gli attacchi di relearning nel machine unlearning.
2. L'over-unlearning deteriora i dati conservati vicini al set dimenticato.
3. L'attacco di relearning prototipico sfrutta i prototipi per classe per ripristinare le prestazioni precedenti all'unlearning.
4. La metrica OU@epsilon quantifica l'over-unlearning nelle regioni prossime al set dimenticato.
5. Spotter è un obiettivo plug-and-play con una penalità di knowledge-distillation mascherata.
6. L'attenzione è sull'unlearning a livello di classe.
7. L'articolo è stato annunciato come replace-cross su arXiv.
8. L'attacco richiede solo pochi campioni della classe dimenticata.

Punti ciechi del machine unlearning: attacchi di over-unlearning e relearning

Fatti principali

Entità

Istituzioni

Fonti