GraphRAG per il Recupero di Schemi EHR Benchmarkato su Hardware Consumer
Uno studio recente ha indagato l'efficacia del Graph-based Retrieval Augmented Generation (GraphRAG) per l'accesso a schemi di Cartelle Cliniche Elettroniche (EHR) utilizzando modelli linguistici di grandi dimensioni open-source. Il sistema Microsoft GraphRAG ha valutato quattro modelli: Llama 3.1 (8 miliardi di parametri), Mistral (7 miliardi), Qwen 2.5 (7 miliardi) e Phi-4-mini (3,8 miliardi), tutti eseguiti su una singola GPU consumer con 8 GB di VRAM tramite la piattaforma Ollama. La ricerca si è concentrata su vari parametri, tra cui l'efficienza di indicizzazione, l'accuratezza delle risposte e le sfide legate a costi e conformità nel settore sanitario, specialmente dove i modelli cloud tradizionali possono fallire con requisiti di dati complessi.
Fatti principali
- GraphRAG estende il retrieval-augmented generation per il ragionamento strutturato su corpora complessi.
- Lo studio valuta GraphRAG per il recupero di schemi EHR utilizzando LLM open-source locali.
- Quattro modelli benchmarkati: Llama 3.1 (8B), Mistral (7B), Qwen 2.5 (7B), Phi-4-mini (3.8B).
- Modelli implementati tramite Ollama su una singola GPU consumer (8 GB VRAM).
- La valutazione include efficienza di indicizzazione, costruzione del grafo di conoscenza, latenza delle query, qualità delle risposte e allucinazioni.
- Il lavoro affronta le sfide di costo, latenza e conformità nel settore sanitario.
- Documentazione reale di schemi EHR utilizzata come materiale di partenza.
- Pipeline Microsoft GraphRAG implementata.
Entità
Istituzioni
- Microsoft
- Ollama