VF-Coder: Il Feedback Visivo Migliora la Generazione di Codice GUI

ai-technology · 2026-04-24

I ricercatori hanno introdotto VF-Coder, un sistema multi-agente che utilizza il feedback visivo per migliorare la generazione e il debug di codice GUI. Gli attuali agenti basati su LLM si affidano a feedback testuali, che falliscono per programmi GUI event-driven con attributi visivi. Per affrontare questo problema, il team ha creato InteractGUI Bench, un benchmark di 984 attività GUI desktop reali per valutare la logica di interazione e la struttura visiva. VF-Coder elabora informazioni visive per simulare interazioni utente e valutare interfacce renderizzate, superando i limiti degli approcci solo testuali. Il sistema mira a colmare il divario nello sviluppo automatizzato di GUI, dove i metodi esistenti non possono attivare la logica degli elementi GUI o verificare la conformità visiva alle esigenze dell'utente. Il lavoro è dettagliato in arXiv:2604.19750.

Fatti principali

VF-Coder utilizza il feedback visivo per la generazione di codice GUI
InteractGUI Bench include 984 attività GUI desktop reali
Gli attuali agenti LLM hanno difficoltà con i programmi GUI event-driven
Il feedback testuale non può valutare gli attributi visivi delle GUI
VF-Coder simula interazioni utente per attivare la logica GUI
Il benchmark valuta la logica di interazione e la struttura visiva
La ricerca è pubblicata su arXiv con ID 2604.19750
Il sistema affronta i limiti nel debug multi-round per GUI

VF-Coder: Il Feedback Visivo Migliora la Generazione di Codice GUI

Fatti principali

Entità

Istituzioni

Fonti