E-TCAV: Interpretabilità Efficiente delle Reti Neurali Basata su Concetti
I ricercatori introducono E-TCAV, un framework per l'approssimazione efficiente dei punteggi TCAV (Testing with Concept Activation Vectors), affrontando il sovraccarico computazionale, il disaccordo tra strati e l'instabilità statistica. Il metodo si basa sull'indagine dei classificatori latenti, l'accordo tra strati e l'uso del penultimo strato come proxy veloce. Le valutazioni coprono quattro architetture e cinque dataset.
Fatti principali
- TCAV valuta l'allineamento tra le rappresentazioni interne delle reti neurali e concetti comprensibili dall'uomo.
- E-TCAV mira a ridurre il sovraccarico computazionale di TCAV.
- E-TCAV affronta il disaccordo tra strati dei punteggi TCAV.
- E-TCAV usa il penultimo strato come proxy veloce per gli strati precedenti.
- Le valutazioni sono state condotte su quattro architetture e cinque dataset.
Entità
—