CheXthought: Dataset globale di ragionamento clinico per l'IA nella radiografia del torace
CheXthought è un dataset multimodale globale contenente 103.592 tracce di ragionamento a catena di pensiero e 6.609.082 annotazioni di attenzione visiva da 501 radiologi in 71 paesi, coprendo 50.312 radiografie toraciche con letture multiple. A differenza dei dataset esistenti che associano solo immagini a referti, cattura i processi cognitivi e l'attenzione visiva alla base del ragionamento clinico. L'analisi rivela distinte strategie di scansione visiva, integrazione del contesto clinico e comunicazione dell'incertezza tra esperti. Il dataset dimostra utilità clinica: il ragionamento di CheXthought supera lo stato dell'arte dei modelli visione-linguaggio a catena di pensiero in accuratezza fattuale e precisione spaziale. Questa risorsa mira a migliorare l'interpretabilità dell'IA e l'affidabilità diagnostica nell'interpretazione delle radiografie toraciche.
Fatti principali
- Il dataset include 103.592 tracce di ragionamento a catena di pensiero
- Contiene 6.609.082 annotazioni di attenzione visiva
- Dati da 501 radiologi in 71 paesi
- Copre 50.312 radiografie toraciche con letture multiple
- Cattura processi cognitivi e attenzione visiva
- Supera lo stato dell'arte dei modelli visione-linguaggio a catena di pensiero
- Migliora accuratezza fattuale e precisione spaziale
- Pubblicato su arXiv con ID 2604.26288
Entità
Istituzioni
- arXiv