L'algoritmo INO-SGD affronta lo squilibrio di utilità nella privacy differenziale individualizzata
Un nuovo algoritmo chiamato INO-SGD affronta lo squilibrio di utilità nella privacy differenziale individualizzata (IDP), un framework che consente ai proprietari dei dati di impostare i propri requisiti di privacy. I metodi IDP esistenti causano una sottorappresentazione dei dati provenienti da proprietari con esigenze di privacy più forti—come quelli con malattie stigmatizzate—nei modelli addestrati, portando a scarse prestazioni su dati simili. L'algoritmo INO-SGD riduce strategicamente il peso di tali dati per mitigare questo bias. La ricerca è pubblicata su arXiv con riferimento 2605.07930.
Fatti principali
- La privacy differenziale (DP) protegge i dati sensibili di addestramento nell'apprendimento automatico.
- La privacy differenziale individualizzata (IDP) consente ai proprietari dei dati di impostare i propri requisiti di privacy.
- I dati provenienti da sottogruppi sensibili (es. casi positivi di malattie stigmatizzate) spesso richiedono una privacy più forte.
- Gli algoritmi IDP esistenti causano uno squilibrio di utilità: i dati con privacy più forte sono sottorappresentati.
- La sottorappresentazione porta a prestazioni peggiori del modello su dati simili durante l'implementazione.
- L'algoritmo INO-SGD riduce strategicamente il peso dei dati con requisiti di privacy più forti.
- L'articolo analizza il problema dello squilibrio di utilità e propone INO-SGD come soluzione.
- La ricerca è disponibile su arXiv con ID 2605.07930.
Entità
Istituzioni
- arXiv