Il campionamento bayesiano potenzia gli attacchi di inferenza di appartenenza
Una nuova tecnica chiamata Bayesian Membership Inference Attack (BMIA) è stata introdotta dai ricercatori, sfruttando il campionamento bayesiano per migliorare sia l'efficacia che l'efficienza degli attacchi di inferenza di appartenenza sui sistemi di machine learning. Gli attacchi di inferenza di appartenenza convenzionali richiedono l'addestramento di diversi modelli di riferimento per valutare le distribuzioni di punteggio condizionali, comportando notevoli costi computazionali. Al contrario, BMIA utilizza l'approssimazione di Laplace su un singolo modello di riferimento per derivare una distribuzione a posteriori sui parametri del modello, consentendo una stima diretta della distribuzione di punteggio condizionale. Teoricamente, il campionamento bayesiano minimizza la varianza intra-modello, aumentando l'efficacia dell'attacco. Questo concetto ispira una variante multi-riferimento che ottimizza ulteriormente le prestazioni con la disponibilità di modelli di riferimento aggiuntivi. Questa ricerca è disponibile su arXiv con ID 2503.07482.
Fatti principali
- Gli attacchi di inferenza di appartenenza (MIA) stimano se un dato è stato utilizzato nell'addestramento di un modello.
- I MIA allo stato dell'arte esistenti si basano sull'addestramento di più modelli di riferimento, causando un elevato costo computazionale.
- BMIA utilizza il campionamento bayesiano con approssimazione di Laplace su un singolo modello di riferimento.
- Il campionamento bayesiano riduce la varianza intra-modello, migliorando la potenza dell'attacco.
- Una variante multi-riferimento di BMIA migliora ulteriormente le prestazioni quando sono disponibili modelli aggiuntivi.
- L'articolo è disponibile su arXiv con ID 2503.07482.
- Il metodo si chiama Bayesian Membership Inference Attack (BMIA).
- L'approccio consente la stima diretta della distribuzione di punteggio condizionale.
Entità
Istituzioni
- arXiv