Mirage Framework Espone le Debolezze della Certificazione del Machine Unlearning
Il Mirage Framework ha rivelato significative vulnerabilità nel processo di certificazione del machine unlearning nell'ambito del vertical federated learning (VFL). Questo framework di auditing utilizza quattro diagnostiche: LPR, CKA, Feature Separability Scoring e Layer-Wise Recovery Analysis. Gli esperimenti condotti su sette dataset e metodi di base hanno mostrato che LPR ha superato il baseline retrained fino a 15,4 punti. Inoltre, CKA ha dimostrato che i modelli rimanevano strutturalmente più simili all'originale che alle versioni retrained. I risultati hanno indicato una persistente discriminazione geometrica, mettendo in discussione le attuali affermazioni di certificazione a livello di output. I risultati sono dettagliati in uno studio disponibile su arXiv, con identificatore 2605.20282.
Fatti principali
- Mirage è un framework di auditing a livello di rappresentazione per il machine unlearning in VFL.
- Include quattro diagnostiche: LPR, CKA, Feature Separability Scoring e Layer-Wise Recovery Analysis.
- Gli esperimenti sono stati condotti su sette dataset e sette metodi di base.
- LPR ha superato il baseline retrained fino a 15,4 punti.
- CKA ha mostrato che i modelli rimangono strutturalmente più vicini all'originale che al riferimento retrained.
- I punteggi di separabilità hanno indicato una persistente discriminazione geometrica.
- Lo studio è pubblicato su arXiv con identificatore 2605.20282.
- Il lavoro mette in discussione le affermazioni di certificazione a livello di output nell'unlearning VFL.
Entità
Istituzioni
- arXiv