Il framework RADD separa il recupero e il riordinamento per il completamento di grafi di conoscenza multimodali
Un nuovo approccio noto come Retrieval-Augmented Discrete Diffusion (RADD) è stato introdotto per il completamento di grafi di conoscenza multimodali (MMKGC). I modelli MMKGC attuali si basano tipicamente su un singolo scorer di embedding sia per il recupero completo delle entità che per il processo decisionale finale, creando un collo di bottiglia poiché le ricerche globali ad alta recall e la precisa disambiguazione locale richiedono bias induttivi distinti. RADD separa queste funzioni attraverso un retriever multimodale KGE sensibile alle relazioni che funge sia da retriever globale che da insegnante per distillazione, insieme a un denoiser discreto condizionale per generare identità di entità a livello di shortlist per il riordinamento. L'addestramento integra supervisione KGE, cross-entropia di denoising e distillazione con scala di temperatura. Durante l'inferenza, il metodo Diff-Rerank crea inizialmente una shortlist top-K con il retriever e successivamente la riordina utilizzando il denoiser, garantendo che il recall preceda la precisione. Questo framework è descritto in un articolo disponibile su arXiv (2604.25693).
Fatti principali
- RADD sta per Retrieval-Augmented Discrete Diffusion
- È progettato per il completamento di grafi di conoscenza multimodali (MMKGC)
- La maggior parte dei modelli MMKGC utilizza un singolo scorer di embedding sia per il recupero che per il processo decisionale
- RADD separa il recupero e il riordinamento in componenti distinti
- Un retriever multimodale KGE sensibile alle relazioni funge da retriever globale e insegnante per distillazione
- Un denoiser discreto condizionale esegue la generazione di identità di entità a livello di shortlist per il riordinamento
- L'addestramento utilizza supervisione KGE, cross-entropia di denoising e distillazione con scala di temperatura
- L'inferenza utilizza Diff-Rerank: shortlist top-K seguita da riordinamento
- L'articolo è disponibile su arXiv con ID 2604.25693
Entità
Istituzioni
- arXiv