UAT-MC: Nuova Difesa contro gli Attacchi di Promozione basati sull'Evitamento nei Sistemi di Raccomandazione Multimodali

ai-technology · 2026-05-09

In un recente studio, i ricercatori hanno scoperto un disallineamento del gradiente cross-modale nei sistemi di raccomandazione multimodali durante scenari di promozione multi-utente. Hanno scoperto che le perturbazioni visive e testuali vengono ottimizzate in direzioni contrastanti a causa dei gruppi di utenti prevalenti, indebolendo l'efficacia degli attacchi e portando a una sottostima dei rischi peggiori durante l'addestramento robusto. Per affrontare questo problema, introducono l'Addestramento Avversario Non Mirato con Coordinamento Multimodale (UAT-MC), che considera ogni elemento come un possibile bersaglio per difendersi dagli attacchi basati sull'evitamento. I risultati sono documentati in arXiv:2605.06238.

Fatti principali

arXiv:2605.06238
I sistemi di raccomandazione multimodali utilizzano segnali visivi e testuali
Il disallineamento del gradiente cross-modale si verifica in contesti di promozione multi-utente
Le perturbazioni visive e testuali sono ottimizzate in direzioni inconsistenti
La dominanza di gruppi di utenti distinti causa il disallineamento
UAT-MC tratta tutti gli elementi come potenziali bersagli
Gli attacchi basati sull'evitamento sono meno esplorati rispetto a quelli basati sull'avvelenamento
Le difese esistenti sono limitate a contesti monomodali

Entità

—

Fonti

arXiv cs.AI — 2026-05-09