CausalFlow-T: Stima degli Effetti del Trattamento da Dati EHR Incompleti
Un nuovo pipeline a due stadi, CausalFlow-T, affronta la stima degli effetti del trattamento da cartelle cliniche elettroniche (EHR) longitudinali incomplete. Il metodo combina un flusso normalizzante vincolato da un grafo aciclico diretto (DAG) con la storia del paziente codificata tramite LSTM per eseguire un'inferenza controfattuale invertibile esatta, evitando errori di approssimazione dovuti all'inferenza variazionale. Separa il confondimento attraverso una struttura causale esplicita, mirando all'alta percentuale di dati mancanti (50%–80%) di biomarcatori mancanti non a caso (MNAR) comuni nelle EHR. L'approccio è validato su quattro benchmark sintetici e uno semi-sintetico con controfattuali noti, mostrando che i vincoli DAG migliorano la robustezza. Il lavoro è pubblicato su arXiv (2605.05125) e mira all'emulazione di trial target (TTE) per domande causali quando gli studi randomizzati controllati non sono fattibili.
Fatti principali
- CausalFlow-T è un pipeline a due stadi per la stima degli effetti del trattamento da EHR longitudinali incomplete.
- Utilizza un flusso normalizzante vincolato da DAG con storia del paziente codificata tramite LSTM.
- Il metodo esegue un'inferenza controfattuale invertibile esatta.
- Evita errori di approssimazione dall'inferenza variazionale.
- L'approccio separa il confondimento attraverso una struttura causale esplicita.
- I biomarcatori MNAR nelle EHR possono raggiungere una percentuale di dati mancanti del 50%–80%.
- La validazione è stata effettuata su quattro benchmark sintetici e uno semi-sintetico.
- L'articolo è pubblicato su arXiv con ID 2605.05125.
Entità
Istituzioni
- arXiv