MACReD: Framework Multi-Agente per l'Analisi di Diagrammi di Reazioni Chimiche
È stato introdotto un innovativo sistema multi-agente gerarchico chiamato MACReD per l'interpretazione di diagrammi di reazioni chimiche presenti in testi scientifici. Questo sistema orchestra agenti specializzati che si concentrano sulla percezione molecolare, la comprensione delle frecce, l'estrazione del testo e la ricostruzione delle reazioni, il tutto all'interno di un quadro coeso guidato da VLM. Affronta problemi come layout diversi, elementi visivi sovrapposti e l'integrazione del riconoscimento con il ragionamento. Utilizzando un rilevamento flessibile a grana fine, i livelli di pianificazione e percezione gestiscono le complessità visive, mentre il livello di ragionamento applica un approccio di fusione multigrafo per combinare vari indizi e garantire un ragionamento chimico globalmente coerente. I test sul benchmark RxnScribe convalidano l'efficienza del framework. Questa ricerca è disponibile su arXiv con ID 2605.28077.
Fatti principali
- MACReD è un framework multi-agente gerarchico per l'analisi di diagrammi di reazioni chimiche.
- Coordina agenti specializzati per la percezione molecolare, la comprensione delle frecce, l'estrazione del testo e la ricostruzione delle reazioni.
- Il framework utilizza un'architettura guidata da VLM.
- I livelli di pianificazione e percezione utilizzano un rilevamento flessibile a grana fine.
- Il livello di ragionamento utilizza un meccanismo di fusione multigrafo.
- Gli esperimenti sono stati condotti sul benchmark RxnScribe.
- L'articolo è disponibile su arXiv con ID 2605.28077.
- Il framework mira a integrare riconoscimento e ragionamento per diagrammi complessi.
Entità
Istituzioni
- arXiv