CodecAttack: Perturbazioni Avversarie Robuste per Modelli Linguistici Audio
I ricercatori hanno sviluppato CodecAttack, un nuovo metodo di attacco avversario per Modelli Linguistici Audio di Grandi Dimensioni (Audio LLM) che rimane efficace anche dopo la preelaborazione di compressione codec. A differenza degli attacchi precedenti che perturbano la forma d'onda audio — che possono essere rilevati e rimossi dalla compressione codec — CodecAttack ottimizza le perturbazioni all'interno dello spazio latente continuo di un codec audio neurale. L'attacco sfrutta il canale di compressione del codec stesso, che scarta le perturbazioni della forma d'onda ma trasmette quelle create nel suo spazio latente. Per migliorare la robustezza attraverso canali di compressione reali, il metodo applica Expectation-over-Transformation (EoT) a multi-bitrate straight-through senza modificare il modello target. L'attacco è stato testato in tre scenari realistici di implementazione di Audio LLM e su tre modelli target, dimostrando un'efficacia costante. Questo lavoro evidenzia una vulnerabilità critica nelle attuali difese contro gli attacchi avversari sui sistemi audio AI.
Fatti principali
- CodecAttack ottimizza le perturbazioni nello spazio latente continuo di un codec audio neurale.
- Gli attacchi precedenti sugli Audio LLM utilizzavano perturbazioni nel dominio della forma d'onda che la compressione codec può rilevare e rimuovere.
- Il canale di compressione del codec trasmette le perturbazioni create nel suo spazio latente.
- Viene applicato Expectation-over-Transformation (EoT) a multi-bitrate straight-through per indurire l'attacco.
- L'attacco non modifica il modello target.
- Testato in tre scenari realistici di implementazione di Audio LLM e su tre modelli target.
- La ricerca è pubblicata su arXiv con ID 2605.20519.
- L'attacco dimostra robustezza contro le difese di compressione codec.
Entità
Istituzioni
- arXiv