Watermark lato input per rilevare copia-incolla da LLM nei compiti degli studenti
I ricercatori propongono un metodo di watermarking lato input per rilevare quando gli studenti inviano risposte generate da LLM senza rielaborazione. I rilevatori di testo AI esistenti sono inaffidabili e penalizzano i non madrelingua, mentre i watermark lato output richiedono la cooperazione dei fornitori. Il nuovo approccio incorpora un'istruzione invisibile nel prompt del compito stesso. Un LLM che elabora il prompt alla lettera legge l'istruzione nascosta e produce una firma rivelatrice nella sua risposta, esponendo il percorso di copia-incolla. Questo metodo è controllato direttamente dagli educatori e non dipende dai fornitori di modelli. Il lavoro è pubblicato su arXiv (2605.16336).
Fatti principali
- arXiv:2605.16336
- Il metodo mira al copia-incolla letterale da LLM
- Watermark lato input controllato dagli educatori
- I rilevatori esistenti sono inaffidabili e penalizzano i non madrelingua
- I watermark lato output richiedono la cooperazione dei fornitori
- Istruzione nascosta incorporata nel prompt del compito
- LLM produce una firma nella risposta se il prompt viene elaborato alla lettera
Entità
Istituzioni
- arXiv