Modello AI sensibile al layout rileva 222 casi di frode d'identità non scoperti
Un nuovo modello AI per il rilevamento di frodi nei documenti d'identità è stato sviluppato, raggiungendo una precisione di classificazione del layout del 99,83% sui documenti canadesi e scoprendo 276 casi di frode fisica adattiva, di cui 222 non rilevati dai sistemi esistenti. La ricerca, pubblicata su arXiv (2605.05215), affronta i limiti della classificazione binaria statica nel rilevamento delle frodi introducendo un apprendimento della rappresentazione sensibile al layout per la scoperta di frodi a insieme aperto. Il modello adatta DINOv3 al dominio dei documenti attraverso un fine-tuning contestuale SimMIM e un apprendimento metrico supervisionato con una funzione di perdita composita che migliora la separabilità tra classi e la compattezza intra-classe. L'addestramento è stato condotto esclusivamente su documenti statunitensi, ma il modello si è generalizzato con successo ai layout canadesi. Su un set di dati di 20.448 documenti canadesi, l'analisi dello spazio di embedding ha rivelato i 276 casi di frode, dimostrando la capacità del sistema di far emergere campagne fraudolente coerenti che evolvono nel tempo. Il classificatore MLP leggero e softmax consente un'implementazione efficiente.
Fatti principali
- Il paper arXiv 2605.05215 introduce l'apprendimento della rappresentazione sensibile al layout per la scoperta di frodi d'identità a insieme aperto.
- Il modello adatta DINOv3 con fine-tuning contestuale SimMIM e apprendimento metrico supervisionato.
- Addestrato solo su documenti statunitensi, raggiunge una precisione di classificazione del layout del 99,83% sui layout canadesi.
- Su 20.448 documenti canadesi, l'analisi dell'embedding ha portato alla luce 276 casi di frode fisica adattiva.
- 222 dei 276 casi di frode non sono stati rilevati dai rilevatori esistenti.
- La funzione di perdita composita incoraggia la separabilità tra classi e la compattezza intra-classe.
- Il modello utilizza un classificatore MLP leggero e softmax per una classificazione efficiente.
- La ricerca affronta gli attaccanti adattivi che modificano modelli e pipeline di fabbricazione.
Entità
Istituzioni
- arXiv
Luoghi
- United States
- Canada