Classificazione ICD automatizzata delle diagnosi psichiatriche utilizzando NLP e LLM
Questo studio si concentra sul miglioramento del modo in cui vengono formulate le diagnosi psichiatriche attraverso l'automazione. Lo fa abbinando descrizioni in testo libero alla Classificazione Internazionale delle Malattie (ICD) con l'aiuto dell'Elaborazione del Linguaggio Naturale (NLP) e dell'Apprendimento Automatico (ML). I ricercatori hanno lavorato con un dataset speciale di 145.513 descrizioni psichiatriche in spagnolo. Hanno testato vari metodi di rappresentazione del testo, dai modelli basati sulla frequenza di base come Bag of Words (BoW) e TF-IDF a modelli linguistici di grandi dimensioni (LLM) più avanzati come e5_large, BioLORD e Llama-3-8B. Gli embedding basati su transformer hanno superato i metodi tradizionali, catturando meglio il linguaggio medico complesso. Il modello e5_large, dopo un esteso fine-tuning, ha raggiunto il punteggio F1_micro più alto di 0,866.
Fatti principali
- Dataset di 145.513 descrizioni psichiatriche in spagnolo utilizzato
- Modelli valutati: BoW, TF-IDF, e5_large, BioLORD, Llama-3-8B
- Gli embedding basati su transformer hanno superato i metodi tradizionali
- e5_large ha raggiunto il punteggio F1_micro più alto di 0,866
- Lo studio affronta il carico amministrativo nella codifica delle diagnosi cliniche
- Focus sul mapping del testo libero ai codici ICD
- La ricerca dimostra il potenziale degli LLM nella diagnostica psichiatrica
Entità
—