MM-StanceDet: Nuovo framework multi-agente per il rilevamento multimodale della posizione
I ricercatori hanno introdotto MM-StanceDet, un innovativo framework multi-agente per il rilevamento multimodale della posizione (MSD) che integra l'ampliamento del recupero, agenti di analisi specializzati, dibattito ragionato e autoriflessione. Il sistema affronta le sfide nella fusione di segnali testuali e visivi, in particolare quando sono in conflitto. Esperimenti su cinque dataset mostrano che supera i baselines all'avanguardia. L'articolo è pubblicato su arXiv nelle categorie informatica e intelligenza artificiale.
Fatti principali
- MM-StanceDet è un framework di rilevamento della posizione multimodale multi-agente potenziato dal recupero.
- Integra l'ampliamento del recupero per un ancoraggio contestuale.
- Utilizza agenti di analisi multimodale specializzati per un'interpretazione sfumata.
- Include una fase di dibattito potenziata dal ragionamento per esplorare prospettive.
- Incorpora l'autoriflessione per una decisione robusta.
- Il sistema affronta le sfide nella fusione di testo e immagini con segnali contrastanti.
- Esperimenti approfonditi su cinque dataset mostrano un superamento significativo dei baselines all'avanguardia.
- L'articolo è disponibile su arXiv nella sezione Computer Science > Artificial Intelligence.
Entità
Istituzioni
- arXiv