Entropia Semantica del Vicino Più Prossimo Allineata alla Domanda per un VQA Chirurgico più Sicuro
Un nuovo stimatore di incertezza per i sistemi di visual question answering (VQA) in ambito chirurgico, noto come Question-Aligned Semantic Nearest Neighbor Entropy (QA-SNNE), è stato introdotto dai ricercatori. A differenza dei metodi esistenti come SNNE, che trascurano la domanda condizionante, QA-SNNE integra efficacemente l'allineamento domanda-risposta nell'entropia semantica. Utilizza un gating bilaterale per prioritizzare le similarità semantiche a coppie tra le risposte campionate in base alla loro rilevanza per la domanda, impiegando tecniche come strategie di allineamento basate su embedding, entailment o cross-encoder. Questo avanzamento è cruciale per migliorare la sicurezza e l'affidabilità dei sistemi VQA in applicazioni chirurgiche, dove risposte ambigue o errate potrebbero mettere a rischio la sicurezza del paziente.
Fatti principali
- QA-SNNE è uno stimatore di incertezza black-box per VQA chirurgico.
- Integra l'allineamento domanda-risposta nell'entropia semantica tramite gating bilaterale.
- SNNE esistente non tiene conto della domanda condizionante.
- QA-SNNE utilizza strategie di allineamento basate su embedding, entailment o cross-encoder.
- Sicurezza e affidabilità sono critiche per il dispiegamento del VQA chirurgico.
- Risposte errate o ambigue possono causare danni al paziente.
- Il metodo pondera le similarità semantiche a coppie tra le risposte campionate.
- Il lavoro è presentato su arXiv con ID 2511.01458.
Entità
Istituzioni
- arXiv