CT-FineBench: Nuovo Benchmark per la Valutazione Dettagliata dei Referti TC
CT-FineBench è un benchmark di fedeltà diagnostica progettato per la valutazione dettagliata della generazione di referti TC. Supera i limiti delle metriche convenzionali come la sovrapposizione lessicale o il matching di entità, che non riescono a cogliere l'accuratezza diagnostica granulare. Costruito a partire dai dataset CT-RATE e Merlin, il benchmark utilizza un meticoloso processo di Domanda-Risposta (QA): identifica attributi clinici chiave (es. posizione, dimensione, margine) e li trasforma in coppie QA che sondano dettagli specifici basati su standard di riferimento. Questo approccio mira a migliorare la coerenza fattuale nella refertazione TC automatizzata.
Fatti principali
- CT-FineBench è un benchmark per la valutazione dettagliata della generazione di referti TC.
- Supera i limiti delle metriche convenzionali come la sovrapposizione lessicale o il matching di entità.
- Costruito a partire dai dataset CT-RATE e Merlin.
- Utilizza un processo basato su QA per identificare e strutturare gli attributi clinici.
- Gli attributi includono posizione, dimensione, margine e altri dettagli orientati alla malattia.
- Le domande sondano dettagli clinici specifici basati su standard di riferimento.
- Mira a migliorare l'accuratezza diagnostica nella refertazione TC automatizzata.
- Si concentra sulla coerenza fattuale nei referti generati.
Entità
—