ARTFEED — Contemporary Art Intelligence

Chat2Workflow Benchmark Introdotto per Generare Flussi di Lavoro Visivi con Linguaggio Naturale

ai-technology · 2026-04-22

Un nuovo benchmark denominato Chat2Workflow è stato sviluppato da ricercatori per valutare la capacità dei grandi modelli linguistici nell'automatizzare la generazione di flussi di lavoro visivi eseguibili a partire da input in linguaggio naturale. Tradizionalmente, la creazione di questi flussi di lavoro - ampiamente utilizzati in contesti industriali per la loro affidabilità e controllo - richiede uno sforzo manuale. Gli sviluppatori affrontano la sfida di progettare i flussi di lavoro, elaborare prompt per ogni fase e adattare la logica secondo necessità, portando a un processo costoso, lungo e soggetto a errori. Questo benchmark deriva da un'ampia gamma di flussi di lavoro aziendali reali, consentendo ai flussi generati di essere facilmente adattati per piattaforme pratiche. Per affrontare frequenti problemi di esecuzione, i ricercatori suggeriscono un solido framework agentico. Questa ricerca, disponibile in arXiv:2604.19667v1, mira ad alleviare il carico di lavoro manuale investigando l'automazione tramite linguaggio naturale.

Fatti principali

  • Chat2Workflow è un benchmark per generare flussi di lavoro visivi eseguibili da linguaggio naturale.
  • I flussi di lavoro visivi eseguibili rappresentano un paradigma mainstream nelle implementazioni industriali del mondo reale.
  • I flussi di lavoro attuali sono costruiti manualmente, rendendo lo sviluppo costoso, dispendioso in termini di tempo e soggetto a errori.
  • Il benchmark è costruito a partire da una vasta raccolta di flussi di lavoro aziendali reali.
  • I flussi di lavoro generati possono essere trasformati e implementati direttamente su piattaforme pratiche di workflow.
  • Viene proposto un robusto framework agentico per mitigare errori di esecuzione ricorrenti.
  • Lo studio esplora se i grandi modelli linguistici possano automatizzare il processo di interazione multi-round.
  • La ricerca è documentata in arXiv:2604.19667v1.

Entità

Fonti