Il sistema M3 consente interrogazioni in linguaggio naturale del database clinico MIMIC-IV
Un team di ricercatori ha presentato M3, un sistema progettato per interrogazioni in linguaggio naturale del Medical Information Mart for Intensive Care (MIMIC-IV), uno dei più grandi database open-source di cartelle cliniche elettroniche a livello globale. Storicamente, l'accesso a MIMIC-IV richiedeva competenze in SQL e conoscenze cliniche. M3 utilizza il Model Context Protocol per facilitare le interrogazioni in inglese semplice. Può recuperare MIMIC-IV da PhysioNet con un singolo comando, sia avviando un'istanza SQLite locale che connettendosi a BigQuery ospitato. Nelle valutazioni rispetto al benchmark EHRSQL 2024, Claude Sonnet 4 ha raggiunto un'accuratezza del 94%, mentre il modello open-weights gpt-oss-20B ha raggiunto il 93% su un insieme di cento domande a cui è possibile rispondere. L'obiettivo del sistema è migliorare l'accesso sicuro ai dati clinici per i ricercatori.
Fatti principali
- M3 consente interrogazioni in linguaggio naturale dei dati MIMIC-IV.
- MIMIC-IV è uno dei più grandi database open-source di cartelle cliniche elettroniche al mondo.
- M3 utilizza il Model Context Protocol.
- M3 recupera dati da PhysioNet.
- M3 può avviare un'istanza SQLite locale o connettersi a BigQuery ospitato.
- Valutato sul benchmark EHRSQL 2024.
- Claude Sonnet 4 ha raggiunto un'accuratezza del 94%.
- gpt-oss-20B ha raggiunto un'accuratezza del 93%.
Entità
Istituzioni
- PhysioNet
- MIMIC-IV
- EHRSQL