ARTFEED — Contemporary Art Intelligence

AnchorDiff: Modello di Diffusione Maschera per la Generazione di Referti Radiologici

other · 2026-05-20

AnchorDiff è un innovativo framework di diffusione maschera per la generazione di referti radiologici (RRG) che integra ancore cliniche derivate da grafi di conoscenza nella modellazione linguistica diffusiva. A differenza dei modelli autoregressivi tradizionali che generano testo da sinistra a destra e soffrono di bias sequenziale, AnchorDiff sfrutta il contesto bidirezionale e il raffinamento iterativo per ancorare meglio i referti alle evidenze specifiche delle immagini. Il framework introduce una strategia di addestramento topology-aware che utilizza gerarchie di entità derivate da RadGraph per assegnare token clinicamente importanti. Questo approccio mira a mitigare le limitazioni della decodifica autoregressiva a ordine fisso e a ridurre la dipendenza da modelli di referti ad alta frequenza.

Fatti principali

  • AnchorDiff è un framework di diffusione maschera per RRG
  • Integra ancore cliniche derivate da grafi di conoscenza
  • Utilizza contesto bidirezionale e raffinamento iterativo
  • Introduce addestramento topology-aware con gerarchie di entità RadGraph
  • Mira a mitigare il bias sequenziale nei modelli autoregressivi
  • Pubblicato su arXiv con ID 2605.17071

Entità

Istituzioni

  • arXiv

Fonti