MedFabric e EtHER: Un framework data-centric per la generazione e rilevazione di invenzioni a livello di parola in LLM medici
Una nuova pipeline data-centric genera invenzioni realistiche a livello di parola per LLM medici, preservando la fedeltà sintattica e stilistica pur introducendo sottili deviazioni fattuali. Il dataset risultante, MedFabric, affronta le limitazioni dei dataset esistenti di allucinazioni mediche, che catturano inadeguatamente i fenomeni di invenzione a causa di copertura limitata, disparità stilistiche e deriva distribuzionale. Basandosi su MedFabric, il rilevatore modulare EtHER integra Text2Table Decomposition, Word Masking and Filling e Hybrid Sentence Pair Evaluation per migliorare l'accuratezza fattuale. Il framework si rivolge al problema ad alto rischio degli LLM che generano affermazioni fattualmente errate ma fluenti in contesti medici.
Fatti principali
- arXiv:2605.04180v1
- MedFabric è un dataset per la generazione di invenzioni a livello di parola.
- EtHER è un rilevatore modulare di invenzioni a livello di parola.
- La pipeline preserva la fedeltà sintattica e stilistica.
- I dataset esistenti di allucinazioni mediche hanno una copertura limitata delle invenzioni.
- Le invenzioni sono affermazioni fattualmente errate ma fluenti.
- I contesti medici presentano il rischio maggiore per le invenzioni.
- EtHER utilizza Text2Table Decomposition, Word Masking and Filling e Hybrid Sentence Pair Evaluation.
Entità
Istituzioni
- arXiv