Watermark Binomiale Multibit per LLM Raggiunge Precisione Superiore
Un nuovo metodo per il watermarking multibit di LLM che utilizza la codifica binomiale codifica ogni bit del payload in tutte le posizioni dei token. Questa tecnica, descritta in arXiv:2605.11653, presenta un codificatore stateful che regola in tempo reale la pressione di codifica, concentrandosi sui bit sottocodificati durante il processo di generazione. Testata su otto baseline con payload fino a 64 bit, questo approccio dimostra una maggiore accuratezza e resilienza del messaggio, in particolare in scenari con payload grandi e bassa distorsione. Inoltre, lo studio introduce un punteggio di confidenza per bit e critica le metriche di valutazione esistenti per la loro insufficiente rilevanza pratica.
Fatti principali
- Propone la codifica binomiale per il watermarking multibit di LLM.
- Codifica ogni bit del payload in ogni posizione del token.
- Include un codificatore stateful che reindirizza dinamicamente la pressione di codifica.
- Valutato su 8 baseline con payload fino a 64 bit.
- Raggiunge una precisione e robustezza del messaggio superiori.
- Il divario rispetto alle baseline si amplia in regimi di payload grandi e bassa distorsione.
- Introduce il punteggio di confidenza per bit.
- Contesta le metriche di valutazione precedenti per la mancanza di approfondimenti pratici.
Entità
Istituzioni
- arXiv