Attacchi di Avvelenamento delle Didascalie ai Sistemi Text-to-Music

ai-technology · 2026-06-01

Un nuovo studio da arXiv rivela una vulnerabilità di sicurezza nei sistemi text-to-music (TTM) con recupero aumentato. I ricercatori propongono un attacco di avvelenamento delle didascalie a doppio strato che inietta didascalie musicali manipolate in un database di conoscenze, causando il recupero di didascalie dannose da parte del sistema e deviando la generazione dall'intento previsto dall'utente. L'attacco sfrutta la dipendenza dall'integrità del database di conoscenze musicali, senza modificare il prompt dell'utente, il recuperatore o il generatore. Negli esperimenti condotti utilizzando il database MusicCaps, il recuperatore CLAP e la pipeline MusicGen, le generazioni avvelenate si sono spostate sostanzialmente più vicine all'intento target scelto dall'attaccante. Lo studio evidenzia una critica falla di sicurezza nei sistemi di musica generata dall'IA.

Fatti principali

Articolo arXiv 2605.30365
Sistemi text-to-music con recupero aumentato vulnerabili all'avvelenamento delle didascalie
Proposta di una strategia di avvelenamento delle didascalie a doppio strato
L'attacco preserva gli ancoraggi di recupero ad alto livello mentre inietta descrittori acustici a basso livello
Esperimenti condotti con database MusicCaps, recuperatore CLAP e pipeline MusicGen
Le generazioni avvelenate si sono spostate più vicine all'intento target scelto dall'attaccante
Nessuna modifica del prompt utente, del recuperatore o del generatore richiesta
La dipendenza dall'integrità del database di conoscenze musicali è la vulnerabilità

Attacchi di Avvelenamento delle Didascalie ai Sistemi Text-to-Music

Fatti principali

Entità

Istituzioni

Fonti