Editing della Rappresentazione Post-Addestramento per la Steganalisi Linguistica Cross-Dominio
Un nuovo approccio noto come REED (Representation Editing) è stato introdotto per la steganalisi linguistica cross-dominio. Nelle applicazioni pratiche, i testi analizzati provengono spesso da domini sconosciuti che presentano vocabolari, argomenti, stili di scrittura e pattern steganografici variabili, compromettendo l'efficacia della rilevazione. Le attuali tecniche cross-dominio si basano sull'allineamento delle distribuzioni e sull'apprendimento di caratteristiche invarianti di dominio, ma spesso risultano insufficienti. REED funziona dopo l'addestramento: il rilevatore viene inizialmente addestrato sui dati del dominio sorgente, quindi il feature extractor e il classificatore vengono congelati, e le rappresentazioni intermedie vengono modificate deterministicamente prima della classificazione. Per l'adattamento al dominio, viene creato un vettore di offset di dominio dalle rappresentazioni marginali sia della sorgente che del target. Un vettore del dominio sorgente viene utilizzato per la generalizzazione del dominio. Questa ricerca è disponibile su arXiv con ID 2605.28298.
Fatti principali
- Nome del metodo: REED (Editing della Rappresentazione Post-Addestramento)
- Affronta la steganalisi linguistica cross-dominio
- I testi testati provengono da domini non visti
- I metodi esistenti utilizzano l'allineamento delle distribuzioni e l'apprendimento di caratteristiche invarianti di dominio
- REED congela il feature extractor e il classificatore dopo l'addestramento
- Le rappresentazioni intermedie vengono modificate deterministicamente prima della classificazione
- L'adattamento al dominio utilizza un vettore di offset di dominio dalle rappresentazioni marginali della sorgente e del target
- La generalizzazione del dominio deriva un vettore del dominio sorgente
- Pubblicato su arXiv: 2605.28298
Entità
Istituzioni
- arXiv