Studio Mette in Discussione l'Efficacia delle Reti Neurali Grafiche per il Rilevamento di Frodi Bitcoin in Contesti Temporali Dinamici
Un nuovo preprint su arXiv, arXiv:2604.19514v1, rivaluta le prestazioni delle Reti Neurali Grafiche (GNN) come GCN, GraphSAGE, GAT ed EvolveGCN sul dataset Elliptic Bitcoin per il rilevamento di frodi. I risultati indicano che, applicando una valutazione strettamente induttiva senza contaminazione, l'assunto che le GNN superino i metodi tradizionali basati su feature risulta errato. Un modello Random Forest che utilizza feature grezze ha ottenuto un punteggio F1 di 0,821, superando tutte le GNN, con GraphSAGE che ha raggiunto solo 0,689 +/- 0,017. Un esperimento controllato ha identificato una differenza di 39,5 punti F1 dovuta all'esposizione dell'addestramento all'adiacenza del periodo di test, rivelando problemi di valutazione. Inoltre, test di edge-shuffle hanno dimostrato che grafi connessi casualmente hanno superato il grafo delle transazioni reali, suggerendo potenziali interpretazioni errate della topologia del dataset in contesti dinamici. Modelli ibridi che combinano embedding GNN con feature grezze hanno prodotto miglioramenti minimi e non hanno raggiunto le prestazioni dei modelli basati solo su feature. Questa ricerca evidenzia la necessità di valutazioni approfondite nell'apprendimento automatico per il rilevamento di frodi finanziarie, specialmente nel regno in rapida evoluzione delle transazioni di criptovalute.
Fatti principali
- Lo studio è pubblicato su arXiv con identificatore arXiv:2604.19514v1.
- Rivaluta le GNN tra cui GCN, GraphSAGE, GAT ed EvolveGCN sul dataset Elliptic Bitcoin.
- Sotto un protocollo strettamente induttivo, Random Forest su feature grezze ha ottenuto F1 = 0,821.
- GraphSAGE ha ottenuto F1 = 0,689 +/- 0,017, sottoperformando rispetto ai metodi basati solo su feature.
- È stato riscontrato un divario di 39,5 punti F1 dovuto all'esposizione dell'addestramento all'adiacenza del periodo di test.
- Esperimenti di edge-shuffle hanno mostrato che grafi cablati casualmente hanno superato il grafo delle transazioni reali.
- Modelli ibridi che combinano embedding GNN con feature grezze hanno offerto solo guadagni marginali.
- I risultati mettono in discussione il consenso ampiamente citato sulla superiorità delle GNN per il rilevamento di frodi Bitcoin.
Entità
Istituzioni
- arXiv