NeuroQA: Benchmark su larga scala per il Visual Question Answering su Risonanza Magnetica 3D del Cervello
NeuroQA è stato lanciato dai ricercatori come un benchmark completo per il visual question answering utilizzando risonanze magnetiche 3D del cervello, con 56.953 coppie domanda-risposta provenienti da 12.977 individui in 12 dataset. Questo dataset copre età che vanno dai 5 ai 104 anni e include cinque aree cliniche: Alzheimer, Parkinson, tumori, malattie della sostanza bianca e neurosviluppo. A differenza delle precedenti iniziative di VQA medico che utilizzavano sezioni 2D o etichette diagnostiche limitate, NeuroQA associa ogni domanda a un volume 3D completo. Testa 11 capacità di ragionamento clinicamente rilevanti attraverso domande Sì/No, a scelta multipla e aperte. Su 203 template, 131 sono basati sull'immagine, mentre 72 sono informati dall'immagine. Per eliminare la dipendenza da scorciatoie basate solo sul testo, l'accuratezza delle risposte a formato chiuso basate solo sul testo è stata ridotta da oltre l'80% al 44,6%, con la necessità delle immagini valutata indipendentemente.
Fatti principali
- NeuroQA include 56.953 coppie QA da 12.977 soggetti in 12 dataset.
- I soggetti hanno un'età compresa tra 5 e 104 anni.
- Copre cinque domini clinici: Alzheimer, Parkinson, tumori, malattie della sostanza bianca e neurosviluppo.
- Ogni elemento è abbinato a un volume 3D completo, a differenza degli approcci precedenti basati su sezioni 2D.
- Valuta 11 capacità di ragionamento clinicamente fondate.
- I formati includono Sì/No, scelta multipla e domande aperte.
- 203 template totali: 131 basati sull'immagine, 72 informati dall'immagine.
- Il perfezionamento della distribuzione delle risposte riduce l'accuratezza basata solo sul testo da >80% al 44,6%.
Entità
—