Pipeline Ibrida Neurale-Simbolica per l'Estrazione di Istruzioni di Follow-Up Clinico
Una pipeline ibrida neurale-simbolica estrae in modo affidabile coppie (azione, data) da note ambulatoriali, raggiungendo punteggi F1 quasi perfetti. Il sistema utilizza BioBERT per il riconoscimento delle entità, un linker biaffine per l'estrazione delle relazioni, un'ontologia di 28 azioni per la canonicalizzazione e una normalizzazione temporale deterministica. Su un corpus sintetico di 2.000 note con suddivisioni azione-disgiunte, ha raggiunto un F1 di coppia al test di 0,997 (viste) e 0,986 (OOV) con un MAE di 0,00 giorni, superando GPT-4o-mini zero-shot e LLaMA-3 8B con messa a punto LoRA. Il lavoro affronta il limite degli estrattori generativi nel collegare le azioni alle date.
Fatti principali
- La pipeline combina BioBERT, linker biaffine, ontologia e normalizzazione deterministica.
- Valutata su un corpus sintetico di 2.000 note ambulatoriali con suddivisioni azione-disgiunte.
- F1 di coppia al test: 0,997 (viste) e 0,986 (OOV).
- Errore assoluto medio di 0,00 giorni.
- Supera GPT-4o-mini zero-shot e LLaMA-3 8B con messa a punto LoRA.
- Definisce le entità TestSpecification e TimeSpecification e la relazione ScheduledFor.
- Ontologia di 28 azioni per la canonicalizzazione.
- Affronta il fallimento dei modelli generativi nel collegare le azioni alle date.
Entità
Istituzioni
- BioBERT
- GPT-4o-mini
- LLaMA-3 8B