Logica Induttiva per l'Interpretabilità Meccanicistica delle Reti Neurali
Un nuovo studio pubblicato su arXiv presenta un approccio strutturato progettato per migliorare la nostra comprensione della scienza meccanicistica nell'interpretabilità delle reti neurali. La ricerca tratta l'interpretazione dei circuiti come un modo per sviluppare teorie induttive, esaminando ciascun circuito a due livelli: una Firma Funzionale Causale (CFS) che collega il comportamento dei componenti all'evidenza causale, e una firma architetturale basata sulla programmazione logica induttiva (ILP) utilizzando predicati strutturali invarianti di scala. Insieme, questi componenti formano uno strato di coerenza che rende più chiare le affermazioni meccanicistiche, consentendo confronti tramite θ-subsumption e adattabilità a diverse dimensioni del modello. L'obiettivo è trasformare le scoperte sui singoli circuiti in una rappresentazione formale coesa, aiutando nel confronto e nell'accumulo di conoscenza meccanicistica.
Fatti principali
- Articolo pubblicato su arXiv con ID 2605.21303
- Tipo di annuncio è cross
- Propone la Firma Funzionale Causale (CFS) per la caratterizzazione dei circuiti
- Utilizza la programmazione logica induttiva (ILP) per la firma architetturale
- La firma architetturale viene appresa da predicati strutturali invarianti di scala
- Le affermazioni sono rese confrontabili tramite θ-subsumption
- Mira a consentire la portabilità tra diverse scale di modello
- Tratta l'interpretazione dei circuiti come costruzione di teorie induttive
Entità
Istituzioni
- arXiv