UAT-MC: Nuova Difesa contro gli Attacchi di Promozione basati sull'Evitamento nei Sistemi di Raccomandazione Multimodali
In un recente studio, i ricercatori hanno scoperto un disallineamento del gradiente cross-modale nei sistemi di raccomandazione multimodali durante scenari di promozione multi-utente. Hanno scoperto che le perturbazioni visive e testuali vengono ottimizzate in direzioni contrastanti a causa dei gruppi di utenti prevalenti, indebolendo l'efficacia degli attacchi e portando a una sottostima dei rischi peggiori durante l'addestramento robusto. Per affrontare questo problema, introducono l'Addestramento Avversario Non Mirato con Coordinamento Multimodale (UAT-MC), che considera ogni elemento come un possibile bersaglio per difendersi dagli attacchi basati sull'evitamento. I risultati sono documentati in arXiv:2605.06238.
Fatti principali
- arXiv:2605.06238
- I sistemi di raccomandazione multimodali utilizzano segnali visivi e testuali
- Il disallineamento del gradiente cross-modale si verifica in contesti di promozione multi-utente
- Le perturbazioni visive e testuali sono ottimizzate in direzioni inconsistenti
- La dominanza di gruppi di utenti distinti causa il disallineamento
- UAT-MC tratta tutti gli elementi come potenziali bersagli
- Gli attacchi basati sull'evitamento sono meno esplorati rispetto a quelli basati sull'avvelenamento
- Le difese esistenti sono limitate a contesti monomodali
Entità
—