La multicollinearità minaccia l'interpretabilità dell'IA nella cybersecurity

ai-technology · 2026-05-23

Un nuovo articolo da arXiv rivela che la multicollinearità in dataset di benchmark come UNSW-NB15 destabilizza gli strumenti di interpretabilità dell'IA come SHAP e LIME utilizzati nei sistemi di rilevamento delle intrusioni. Gli autori dimostrano matematicamente che le caratteristiche correlate aumentano la varianza delle attribuzioni, rendendo le spiegazioni non identificabili. Esperimenti su modelli lineari, basati su alberi, kernel e neurali confermano la fragilità. Introducono l'Explanability Fragility Score e due metodi di mitigazione basati su VIF e soglia di correlazione.

Fatti principali

ID articolo: arXiv:2605.22529
Studia l'instabilità indotta dalla multicollinearità nell'interpretabilità dell'IA per il rilevamento delle intrusioni
Teorema formale: la multicollinearità aumenta la varianza delle attribuzioni
Esperimenti sul dataset di benchmark UNSW-NB15
Valuta modelli lineari, basati su alberi, kernel e neurali
Propone la metrica Explanability Fragility Score
Due nuovi metodi di mitigazione basati su VIF e soglia di correlazione
Pubblicato su arXiv

La multicollinearità minaccia l'interpretabilità dell'IA nella cybersecurity

Fatti principali

Entità

Istituzioni

Fonti