LLM per lo Screening di Trial Clinici: il RAG Migliora la Localizzazione delle Evidenze nelle Narrazioni delle Cartelle Cliniche Elettroniche
Uno studio recente disponibile su arXiv (2604.05190) indaga il potenziale dei modelli linguistici di grandi dimensioni (LLM) per snellire il processo di screening dei pazienti a partire da narrazioni longitudinali di cartelle cliniche elettroniche (EHR) ai fini del reclutamento per trial clinici. Questa ricerca affronta la significativa sfida del sotto-reclutamento valutando sia LLM generativi basati su encoder che su decoder, inclusi quelli adattati per uso medico. Per affrontare il problema 'Lost in the Middle' in documenti lunghi, vengono esaminate tre strategie: finestre di contesto lungo originali, riassunto estrattivo basato su NER e generazione aumentata da recupero (RAG) per il recupero in tempo reale delle evidenze allineate ai criteri di eleggibilità. La valutazione utilizza il dataset benchmark N2C2 Track 1 del 2018. Questo lavoro è stato pubblicato su arXiv con l'identificatore 2604.05190v2, classificato come annuncio replace-cross.
Fatti principali
- Lo studio esplora sistematicamente gli LLM per lo screening di trial clinici da narrazioni EHR.
- Confronta LLM generativi basati su encoder e decoder.
- Esamina LLM di uso generale e adattati per uso medico.
- Affronta il problema 'Lost in the Middle' in documenti lunghi.
- Testa tre strategie: contesto lungo originale, riassunto basato su NER e RAG.
- Utilizza il dataset benchmark N2C2 Track 1 del 2018 per la valutazione.
- Pubblicato su arXiv con ID 2604.05190v2.
- Il tipo di annuncio è replace-cross.
Entità
Istituzioni
- arXiv