PLOT: Nuovo Framework per Astrazione Causale Neurale tramite Trasporto Ottimale
È stato introdotto un nuovo framework chiamato PLOT (Progressive Localization via Optimal Transport) per l'astrazione causale neurale, un metodo per l'interpretabilità meccanicistica. PLOT utilizza il trasporto ottimale per localizzare variabili causali analizzando la geometria dell'effetto di output di interventi astratti e neurali, adattando un accoppiamento tra variabili astratte e siti neurali candidati per produrre una corrispondenza morbida globale. Questo approccio affronta il carico computazionale dei metodi esistenti come la ricerca di allineamento distribuito (DAS), che richiedono la ricerca su siti candidati. In contesti semplici, PLOT funziona con un singolo accoppiamento su singoli neuroni; per modelli più grandi, viene applicato progressivamente.
Fatti principali
- PLOT sta per Progressive Localization via Optimal Transport.
- È un framework basato sul trasporto per l'astrazione causale neurale.
- Localizza variabili causali dalla geometria dell'effetto di output di interventi astratti e neurali.
- Adatta un accoppiamento di trasporto ottimale tra variabili astratte e siti neurali candidati.
- L'accoppiamento produce una corrispondenza morbida globale che può essere calibrata in handle di intervento.
- In contesti semplici, un singolo accoppiamento su singoli neuroni è sufficiente.
- Nei modelli più grandi, PLOT viene applicato progressivamente.
- Il framework affronta i carichi computazionali dei metodi esistenti come DAS.
Entità
—