EdgeFlow: VLM potenziato con mappa dei bordi per l'elaborazione di diagrammi di flusso

other · 2026-05-27

EdgeFlow è un metodo che potenzia i Vision Language Models (VLM) per convertire immagini statiche di diagrammi di flusso in codice Mermaid leggibile dalla macchina, mirando all'ingegneria dei requisiti industriale. Aumentando l'input del VLM con una mappa dei bordi Canny estratta deterministicamente come priorità strutturale, migliora la cattura dei dettagli critici per la topologia senza richiedere dati di addestramento annotati o fine-tuning. Valutato sul dataset IndusReqFlow proveniente da requisiti reali, EdgeFlow ottiene un miglioramento dell'F1 a livello di nodo di 17,39 punti percentuali, a livello di arco di 16,94 punti percentuali e a livello di percorso di 11,06 punti percentuali rispetto ai VLM standard. L'approccio affronta i fallimenti nell'applicazione diretta dei VLM alla conversione di diagrammi di flusso, consentendo un migliore supporto per le attività di ingegneria dei requisiti basate su modelli.

Fatti principali

EdgeFlow potenzia l'input del VLM con una mappa dei bordi Canny come priorità strutturale.
Non richiede dati di addestramento annotati o fine-tuning specifico del dominio.
Valutato sul dataset IndusReqFlow proveniente da requisiti reali.
F1 a livello di nodo migliorato di 17,39 punti percentuali.
F1 a livello di arco migliorato di 16,94 punti percentuali.
F1 a livello di percorso migliorato di 11,06 punti percentuali.
Obiettivo: conversione di immagini statiche di diagrammi di flusso in codice Mermaid leggibile dalla macchina.
Affronta i fallimenti nei dettagli visivi critici per la topologia nell'applicazione diretta dei VLM.

Entità

—

Fonti

arXiv cs.AI — 2026-05-27