Nuova metrica e metodo per XAI quantificabile senza verità di base
Un recente framework propone un approccio misurabile per valutare le tecniche di Explainable AI (XAI) in assenza di verità di base, utilizzando la perturbazione continua dell'input. Questa metrica affronta formalmente la sufficienza e la necessità delle informazioni attribuite alle decisioni del modello, offrendo un allineamento più stretto con l'intuizione umana rispetto alle metriche attuali. Inoltre, gli autori presentano una tecnica XAI innovativa che perfeziona un modello impiegando un'approssimazione differenziabile della metrica come guida, portando allo sviluppo di un modulo adattatore che consente ai modelli black-box di fornire spiegazioni causali.
Fatti principali
- arXiv:2605.18681v1
- Tipo di annuncio: nuovo
- Abstract: Le tecniche di Explainable AI (XAI) sono sempre più importanti per la validazione e l'uso responsabile dei modelli di deep learning.
- Propone un framework per una metrica quantificabile per metodi XAI basata sulla perturbazione continua dell'input.
- La metrica considera la sufficienza e la necessità delle informazioni attribuite al processo decisionale del modello.
- La metrica si allinea meglio con le intuizioni umane sulla qualità della spiegazione rispetto alle metriche esistenti.
- Nuovo metodo XAI che ottimizza un modello utilizzando un'approssimazione differenziabile della metrica come segnale di supervisione.
- Il risultato è un modulo adattatore che può essere addestrato sopra qualsiasi modello black-box per produrre spiegazioni causali.
Entità
Istituzioni
- arXiv