Luminol-AIDetect: Rilevamento Zero-Shot di Testo Generato da Macchina tramite Variazioni di Perplessità
I ricercatori propongono Luminol-AIDetect, un metodo statistico zero-shot per rilevare testo generato da macchina (MGT) sfruttando la fragilità strutturale dei modelli linguistici autoregressivi. L'approccio applica un rimescolamento casuale del testo e misura le variazioni di perplessità, che sono più disperse per MGT rispetto al testo umano. Questa tecnica agnostica rispetto al modello evita la dipendenza da impronte digitali di generazione specifiche e richiede solo poche caratteristiche scalari per la classificazione. Il metodo è descritto nel preprint arXiv 2604.25860.
Fatti principali
- Luminol-AIDetect è un approccio statistico zero-shot per il rilevamento di MGT.
- Utilizza il rimescolamento casuale del testo per interrompere la coerenza.
- La dispersione della perplessità sotto rimescolamento differisce tra MGT e testo umano.
- Il metodo è agnostico rispetto al modello e non si basa su impronte digitali di generazione specifiche.
- Richiede solo una manciata di caratteristiche scalari basate sulla perplessità.
- La ricerca è pubblicata su arXiv con ID 2604.25860.
- L'ipotesi è che i LLM autoregressivi abbiano fragilità strutturale.
- L'approccio espone la fragilità attraverso l'interruzione della coerenza.
Entità
Istituzioni
- arXiv