La strategia di serializzazione FHIR influisce significativamente sulle prestazioni di riconciliazione farmacologica degli LLM
Una recente indagine pubblicata su arXiv (2604.21076) valuta quattro metodi di serializzazione FHIR—Raw JSON, Tabella Markdown, Narrazione Clinica e Cronologia Temporale—utilizzando cinque grandi modelli linguistici con pesi aperti (Phi-3.5-mini, Mistral-7B, BioMistral-7B, Llama-3.1-8B, Llama-3.3-70B) su un benchmark che coinvolge 200 pazienti sintetici (4.000 esecuzioni di inferenza). L'analisi rivela che per modelli con fino a 8 miliardi di parametri, la Narrazione Clinica supera il Raw JSON fino a 19 punti F1 (Mistral-7B, r=0,617, p<10^{-10}). Al contrario, il Raw JSON eccelle a 70 miliardi di parametri, invertendo la tendenza. Questi risultati sottolineano l'importanza della strategia di serializzazione nell'utilizzo degli LLM per dati clinici strutturati in FHIR nella riconciliazione farmacologica.
Fatti principali
- Lo studio confronta quattro strategie di serializzazione FHIR: Raw JSON, Tabella Markdown, Narrazione Clinica, Cronologia Temporale.
- Sono stati testati cinque modelli a pesi aperti: Phi-3.5-mini, Mistral-7B, BioMistral-7B, Llama-3.1-8B, Llama-3.3-70B.
- Il benchmark utilizza 200 pazienti sintetici con 4.000 esecuzioni di inferenza.
- La Narrazione Clinica supera il Raw JSON fino a 19 punti F1 per Mistral-7B.
- A 70 miliardi di parametri, il Raw JSON raggiunge le migliori prestazioni.
- La strategia di serializzazione ha un effetto statisticamente significativo sui modelli fino a 8 miliardi di parametri.
- Coefficiente di correlazione r=0,617, p<10^{-10} per il confronto con Mistral-7B.
- La riconciliazione farmacologica nei passaggi di consegna clinici è un processo ad alto rischio e soggetto a errori.
Entità
Istituzioni
- arXiv