Hashing multimodale con preservazione dei motivi e privacy differenziale

other · 2026-05-18

Un recente studio pubblicato su arXiv (2605.15460) presenta DMP-MH, un nuovo framework volto a consentire l'hashing cross-modale che preserva la privacy. Questa tecnica codifica sia immagini che testo in codici binari compatti per un recupero semplificato. Tuttavia, i metodi tradizionali dipendono da grafi di similarità semantica derivati dalle interazioni degli utenti, che sono suscettibili ad attacchi di ricostruzione dei collegamenti. Le soluzioni di privacy esistenti sono inadeguate: il SGD con privacy differenziale compromette i pattern relazionali, mentre le tecniche di sintesi dei grafi incontrano l'Hubness Explosion, dove alcuni nodi influenzano in modo sproporzionato i conteggi dei triangoli, richiedendo rumore eccessivo. DMP-MH affronta questi problemi attraverso un approccio Sanitize-then-Distill, che separa le preoccupazioni sulla privacy dall'apprendimento della rappresentazione limitando la sensibilità tramite il clipping deterministico del grado dei nodi.

Fatti principali

L'articolo arXiv:2605.15460 propone DMP-MH per l'hashing cross-modale che preserva la privacy.
L'hashing cross-modale codifica immagini e testo in codici binari compatti.
I metodi esistenti utilizzano grafi di similarità semantica dalle interazioni degli utenti.
Questi grafi sono vulnerabili ad attacchi di ricostruzione dei collegamenti.
Il SGD con privacy differenziale distrugge i motivi relazionali.
I metodi di sintesi dei grafi soffrono di Hubness Explosion.
I nodi hub causano modifiche a singolo bordo che alterano i conteggi dei triangoli di O(N).
DMP-MH utilizza un framework Sanitize-then-Distill con clipping deterministico del grado dei nodi.

Hashing multimodale con preservazione dei motivi e privacy differenziale

Fatti principali

Entità

Istituzioni

Fonti