E-TCAV: Interpretabilità Efficiente delle Reti Neurali Basata su Concetti

ai-technology · 2026-05-12

I ricercatori introducono E-TCAV, un framework per l'approssimazione efficiente dei punteggi TCAV (Testing with Concept Activation Vectors), affrontando il sovraccarico computazionale, il disaccordo tra strati e l'instabilità statistica. Il metodo si basa sull'indagine dei classificatori latenti, l'accordo tra strati e l'uso del penultimo strato come proxy veloce. Le valutazioni coprono quattro architetture e cinque dataset.

Fatti principali

TCAV valuta l'allineamento tra le rappresentazioni interne delle reti neurali e concetti comprensibili dall'uomo.
E-TCAV mira a ridurre il sovraccarico computazionale di TCAV.
E-TCAV affronta il disaccordo tra strati dei punteggi TCAV.
E-TCAV usa il penultimo strato come proxy veloce per gli strati precedenti.
Le valutazioni sono state condotte su quattro architetture e cinque dataset.

Entità

—

Fonti

arXiv cs.AI — 2026-05-12