La stima dell'informazione mutua neurale migliora la decodifica dei modelli di diffusione mascherati
Una nuova architettura neurale valuta direttamente l'informazione mutua (MI) condizionale a coppie dagli stati nascosti di modelli di diffusione mascherati (MDM) pre-addestrati. Questo stimatore, addestrato sulle distribuzioni condizionali del modello stesso utilizzando la MI reale, cattura efficacemente le credenze di dipendenza interna e prevede l'intera matrice MI in un unico passaggio in avanti. Questa capacità facilita la decodifica parallela guidata dalla MI, individuando sottoinsiemi di variabili condizionalmente indipendenti. Testato su Sudoku e generazione di sequenze proteiche utilizzando ESM-C, le mappe MI recuperano con successo vincoli strutturali noti e riducono i passaggi in avanti durante l'inferenza di un fattore da 3 a 5.
Fatti principali
- Propone uno stimatore neurale per la MI condizionale a coppie dagli stati nascosti degli MDM
- Utilizza la MI reale dalle distribuzioni condizionali del modello come supervisione
- Prevede l'intera matrice MI in un unico passaggio in avanti
- Consente la decodifica parallela guidata dalla MI tramite sottoinsiemi condizionalmente indipendenti
- Testato su Sudoku e generazione di proteine con ESM-C
- Le mappe MI recuperano vincoli strutturali noti
- Riduce i passaggi in avanti durante l'inferenza di un fattore 3-5x
Entità
—