AnchorDiff: Modello di Diffusione Maschera per la Generazione di Referti Radiologici

other · 2026-05-20

AnchorDiff è un innovativo framework di diffusione maschera per la generazione di referti radiologici (RRG) che integra ancore cliniche derivate da grafi di conoscenza nella modellazione linguistica diffusiva. A differenza dei modelli autoregressivi tradizionali che generano testo da sinistra a destra e soffrono di bias sequenziale, AnchorDiff sfrutta il contesto bidirezionale e il raffinamento iterativo per ancorare meglio i referti alle evidenze specifiche delle immagini. Il framework introduce una strategia di addestramento topology-aware che utilizza gerarchie di entità derivate da RadGraph per assegnare token clinicamente importanti. Questo approccio mira a mitigare le limitazioni della decodifica autoregressiva a ordine fisso e a ridurre la dipendenza da modelli di referti ad alta frequenza.

Fatti principali

AnchorDiff è un framework di diffusione maschera per RRG
Integra ancore cliniche derivate da grafi di conoscenza
Utilizza contesto bidirezionale e raffinamento iterativo
Introduce addestramento topology-aware con gerarchie di entità RadGraph
Mira a mitigare il bias sequenziale nei modelli autoregressivi
Pubblicato su arXiv con ID 2605.17071

AnchorDiff: Modello di Diffusione Maschera per la Generazione di Referti Radiologici

Fatti principali

Entità

Istituzioni

Fonti