Monitor di Riferimento per Canali Nascosti in Uscita di Agenti LLM
Un nuovo articolo su arXiv propone un monitor di riferimento per rilevare canali nascosti nell'uscita di agenti LLM. Il sistema affronta la fuga di dati attraverso tecniche steganografiche in testo, immagini e audio. I contributi includono una pipeline di testo con dieci fasi di riduzione della capacità, un registro di capacità a secchio che perde, e scrambler multimediali per audio e immagini controllati da attestazione crittografica.
Fatti principali
- arXiv:2605.20734v1
- Tipo di annuncio: cross
- I canali nascosti includono caratteri a larghezza zero, omoglifi, spazi bianchi, base64, ordinamento delle chiavi JSON, temporizzazione o dimensione dei messaggi
- I canali di uscita binari includono piani di bit LSB, luminanza media per immagine, permutazione di sequenza tra immagini, toni ultrasonici, dati sonificati in banda udibile
- La pipeline di testo ha dieci fasi di riduzione della capacità
- Registro di capacità a secchio che perde per sink
- Postura a fasi impone fasi senza perdite dal primo giorno
- Due scrambler multimediali: limitatore di banda audio nel dominio di Fourier e quantizzatore di profondità di bit e luminanza media per immagini RGB
- L'attestazione crittografica di legittimità all'avvio controlla gli scrambler
Entità
Istituzioni
- arXiv