Logica Induttiva per l'Interpretabilità Meccanicistica delle Reti Neurali

ai-technology · 2026-05-22

Un nuovo studio pubblicato su arXiv presenta un approccio strutturato progettato per migliorare la nostra comprensione della scienza meccanicistica nell'interpretabilità delle reti neurali. La ricerca tratta l'interpretazione dei circuiti come un modo per sviluppare teorie induttive, esaminando ciascun circuito a due livelli: una Firma Funzionale Causale (CFS) che collega il comportamento dei componenti all'evidenza causale, e una firma architetturale basata sulla programmazione logica induttiva (ILP) utilizzando predicati strutturali invarianti di scala. Insieme, questi componenti formano uno strato di coerenza che rende più chiare le affermazioni meccanicistiche, consentendo confronti tramite θ-subsumption e adattabilità a diverse dimensioni del modello. L'obiettivo è trasformare le scoperte sui singoli circuiti in una rappresentazione formale coesa, aiutando nel confronto e nell'accumulo di conoscenza meccanicistica.

Fatti principali

Articolo pubblicato su arXiv con ID 2605.21303
Tipo di annuncio è cross
Propone la Firma Funzionale Causale (CFS) per la caratterizzazione dei circuiti
Utilizza la programmazione logica induttiva (ILP) per la firma architetturale
La firma architetturale viene appresa da predicati strutturali invarianti di scala
Le affermazioni sono rese confrontabili tramite θ-subsumption
Mira a consentire la portabilità tra diverse scale di modello
Tratta l'interpretazione dei circuiti come costruzione di teorie induttive

Logica Induttiva per l'Interpretabilità Meccanicistica delle Reti Neurali

Fatti principali

Entità

Istituzioni

Fonti