TRACE Pipeline Riduce il Gonfiore delle Note Cliniche per l'Efficienza degli LLM in Sanità
TRACE, una pipeline di pre-elaborazione di recente sviluppo, mira ad affrontare il problema della duplicazione testuale nella documentazione clinica, che aumenta i costi computazionali per i grandi modelli linguistici. Gli ambienti sanitari contemporanei spesso dipendono da modelli, tecniche di copia-incolla e campi compilati automaticamente, portando a un eccessivo gonfiore delle note che oscura le informazioni clinicamente rilevanti. Utilizzando i metadati di attribuzione EHR, TRACE identifica i contenuti basati su modelli e replicati, implementando una deduplicazione basata sulla frequenza quando i metadati sono assenti. Il sistema è stato valutato su quattro coorti cliniche, trapianto di fegato, ostetricia e assistenza ospedaliera, comprendendo 5,3 milioni di note. Valutazioni di medici in cieco e successivi compiti di modellazione hanno rivelato che TRACE ha eliminato il 47,3% del testo delle cartelle mantenendo l'efficacia nell'estrazione delle informazioni e nel supporto alle decisioni cliniche. I risultati sono stati pubblicati su arXiv con identificatore 2604.16364v1, classificati come annuncio incrociato.
Fatti principali
- TRACE è una pipeline di pre-elaborazione scalabile che rimuove il gonfiore delle note cliniche
- Le pratiche di documentazione moderne si basano su modelli, scorciatoie di copia-incolla e campi compilati automaticamente
- Il gonfiore delle note diluisce il segnale clinicamente significativo e aumenta i costi computazionali per gli LLM
- TRACE utilizza i metadati di attribuzione EHR per identificare i contenuti basati su modelli e copiati
- La deduplicazione basata sulla frequenza viene applicata quando i metadati non sono disponibili
- La valutazione ha coperto quattro coorti cliniche reali: trapianto di fegato, ostetricia e assistenza ospedaliera
- L'analisi ha coinvolto 5,3 milioni di note cliniche
- TRACE ha rimosso il 47,3% del testo delle cartelle preservando le prestazioni per l'estrazione delle informazioni e le applicazioni cliniche
Entità
Istituzioni
- arXiv