ArcMark: Watermark multi-byte senza distorsioni per LLM tramite trasporto ottimale
I ricercatori hanno sviluppato ArcMark, un nuovo metodo di watermarking per modelli linguistici di grandi dimensioni (LLM) in grado di incorporare più byte di informazione nel testo generato senza distorcere le previsioni dei token. I watermark esistenti tipicamente codificano un singolo bit per token, limitandone la capacità. ArcMark, basato su principi di codifica e teoria dell'informazione, può incorporare in modo affidabile dati come ID utente, versioni del modello o persino il prompt stesso, ampliando drasticamente le potenziali applicazioni per un uso responsabile degli LLM. L'approccio è presentato in un articolo su arXiv (2602.07235) e promette un watermarking multi-byte senza distorsioni.
Fatti principali
- ArcMark è un nuovo metodo di watermarking multi-byte per LLM.
- Incorpora informazioni senza perturbare le previsioni medie del token successivo.
- I watermark esistenti tipicamente codificano un singolo bit per token.
- ArcMark può incorporare ID utente, versioni del modello o prompt.
- Il metodo si basa su principi di codifica e teoria dell'informazione.
- L'articolo è disponibile su arXiv con ID 2602.07235.
- Mira a promuovere l'uso responsabile dei modelli linguistici di grandi dimensioni.
- L'approccio è descritto come privo di distorsioni.
Entità
Istituzioni
- arXiv