Hashing multimodale con preservazione dei motivi e privacy differenziale
Un recente studio pubblicato su arXiv (2605.15460) presenta DMP-MH, un nuovo framework volto a consentire l'hashing cross-modale che preserva la privacy. Questa tecnica codifica sia immagini che testo in codici binari compatti per un recupero semplificato. Tuttavia, i metodi tradizionali dipendono da grafi di similarità semantica derivati dalle interazioni degli utenti, che sono suscettibili ad attacchi di ricostruzione dei collegamenti. Le soluzioni di privacy esistenti sono inadeguate: il SGD con privacy differenziale compromette i pattern relazionali, mentre le tecniche di sintesi dei grafi incontrano l'Hubness Explosion, dove alcuni nodi influenzano in modo sproporzionato i conteggi dei triangoli, richiedendo rumore eccessivo. DMP-MH affronta questi problemi attraverso un approccio Sanitize-then-Distill, che separa le preoccupazioni sulla privacy dall'apprendimento della rappresentazione limitando la sensibilità tramite il clipping deterministico del grado dei nodi.
Fatti principali
- L'articolo arXiv:2605.15460 propone DMP-MH per l'hashing cross-modale che preserva la privacy.
- L'hashing cross-modale codifica immagini e testo in codici binari compatti.
- I metodi esistenti utilizzano grafi di similarità semantica dalle interazioni degli utenti.
- Questi grafi sono vulnerabili ad attacchi di ricostruzione dei collegamenti.
- Il SGD con privacy differenziale distrugge i motivi relazionali.
- I metodi di sintesi dei grafi soffrono di Hubness Explosion.
- I nodi hub causano modifiche a singolo bordo che alterano i conteggi dei triangoli di O(N).
- DMP-MH utilizza un framework Sanitize-then-Distill con clipping deterministico del grado dei nodi.
Entità
Istituzioni
- arXiv