AnchorDiff: Modello di Diffusione Maschera per la Generazione di Referti Radiologici
AnchorDiff è un innovativo framework di diffusione maschera per la generazione di referti radiologici (RRG) che integra ancore cliniche derivate da grafi di conoscenza nella modellazione linguistica diffusiva. A differenza dei modelli autoregressivi tradizionali che generano testo da sinistra a destra e soffrono di bias sequenziale, AnchorDiff sfrutta il contesto bidirezionale e il raffinamento iterativo per ancorare meglio i referti alle evidenze specifiche delle immagini. Il framework introduce una strategia di addestramento topology-aware che utilizza gerarchie di entità derivate da RadGraph per assegnare token clinicamente importanti. Questo approccio mira a mitigare le limitazioni della decodifica autoregressiva a ordine fisso e a ridurre la dipendenza da modelli di referti ad alta frequenza.
Fatti principali
- AnchorDiff è un framework di diffusione maschera per RRG
- Integra ancore cliniche derivate da grafi di conoscenza
- Utilizza contesto bidirezionale e raffinamento iterativo
- Introduce addestramento topology-aware con gerarchie di entità RadGraph
- Mira a mitigare il bias sequenziale nei modelli autoregressivi
- Pubblicato su arXiv con ID 2605.17071
Entità
Istituzioni
- arXiv