Watermark lato input per rilevare copia-incolla da LLM nei compiti degli studenti

ai-technology · 2026-05-20

I ricercatori propongono un metodo di watermarking lato input per rilevare quando gli studenti inviano risposte generate da LLM senza rielaborazione. I rilevatori di testo AI esistenti sono inaffidabili e penalizzano i non madrelingua, mentre i watermark lato output richiedono la cooperazione dei fornitori. Il nuovo approccio incorpora un'istruzione invisibile nel prompt del compito stesso. Un LLM che elabora il prompt alla lettera legge l'istruzione nascosta e produce una firma rivelatrice nella sua risposta, esponendo il percorso di copia-incolla. Questo metodo è controllato direttamente dagli educatori e non dipende dai fornitori di modelli. Il lavoro è pubblicato su arXiv (2605.16336).

Fatti principali

arXiv:2605.16336
Il metodo mira al copia-incolla letterale da LLM
Watermark lato input controllato dagli educatori
I rilevatori esistenti sono inaffidabili e penalizzano i non madrelingua
I watermark lato output richiedono la cooperazione dei fornitori
Istruzione nascosta incorporata nel prompt del compito
LLM produce una firma nella risposta se il prompt viene elaborato alla lettera

Watermark lato input per rilevare copia-incolla da LLM nei compiti degli studenti

Fatti principali

Entità

Istituzioni

Fonti