ARTFEED — Contemporary Art Intelligence

Attacchi di Avvelenamento delle Didascalie ai Sistemi Text-to-Music

ai-technology · 2026-06-01

Un nuovo studio da arXiv rivela una vulnerabilità di sicurezza nei sistemi text-to-music (TTM) con recupero aumentato. I ricercatori propongono un attacco di avvelenamento delle didascalie a doppio strato che inietta didascalie musicali manipolate in un database di conoscenze, causando il recupero di didascalie dannose da parte del sistema e deviando la generazione dall'intento previsto dall'utente. L'attacco sfrutta la dipendenza dall'integrità del database di conoscenze musicali, senza modificare il prompt dell'utente, il recuperatore o il generatore. Negli esperimenti condotti utilizzando il database MusicCaps, il recuperatore CLAP e la pipeline MusicGen, le generazioni avvelenate si sono spostate sostanzialmente più vicine all'intento target scelto dall'attaccante. Lo studio evidenzia una critica falla di sicurezza nei sistemi di musica generata dall'IA.

Fatti principali

  • Articolo arXiv 2605.30365
  • Sistemi text-to-music con recupero aumentato vulnerabili all'avvelenamento delle didascalie
  • Proposta di una strategia di avvelenamento delle didascalie a doppio strato
  • L'attacco preserva gli ancoraggi di recupero ad alto livello mentre inietta descrittori acustici a basso livello
  • Esperimenti condotti con database MusicCaps, recuperatore CLAP e pipeline MusicGen
  • Le generazioni avvelenate si sono spostate più vicine all'intento target scelto dall'attaccante
  • Nessuna modifica del prompt utente, del recuperatore o del generatore richiesta
  • La dipendenza dall'integrità del database di conoscenze musicali è la vulnerabilità

Entità

Istituzioni

  • arXiv
  • MusicCaps
  • CLAP
  • MusicGen

Fonti