SWAN: Watermarking Semantico tramite Rappresentazione Astratta del Significato
Un nuovo framework chiamato SWAN (Semantic Watermarking with Abstract Meaning Representation) incorpora firme watermark nella struttura semantica delle frasi utilizzando AMR. A differenza dei metodi a livello di token, SWAN codifica le firme a livello semantico, rendendole robuste alla parafrasi. Il metodo non richiede addestramento: l'iniezione utilizza un LLM guidato da template AMR, la rilevazione utilizza un parser AMR standard e un test z. Valutato su RealNews, SWAN eguaglia le prestazioni di rilevazione allo stato dell'arte.
Fatti principali
- SWAN sta per Semantic Watermarking with Abstract Meaning Representation.
- Le firme watermark sono incorporate nella struttura semantica di una frase utilizzando AMR.
- I metodi esistenti codificano le firme regolando la selezione dei token durante la generazione del testo.
- SWAN codifica la firma direttamente nella rappresentazione semantica della frase.
- Qualsiasi parafrasi che preserva il significato preserva automaticamente la firma.
- SWAN non richiede addestramento: l'iniezione utilizza un LLM guidato da template AMR selezionati.
- La rilevazione utilizza un parser AMR standard seguito da un test z per una proporzione.
- La valutazione empirica sul benchmark RealNews mostra che SWAN eguaglia le prestazioni di rilevazione allo stato dell'arte.
Entità
—