ARTFEED — Contemporary Art Intelligence

WebChain Dataset Avanza la Ricerca sugli Agenti Web AI con Dati di Interazione Umana del Mondo Reale

ai-technology · 2026-04-15

WebChain rappresenta la più ampia raccolta open-source di sequenze di interazione web annotate da esseri umani disponibile per scopi di ricerca. Questo dataset contiene 31.725 traiettorie complete e 318.000 passaggi individuali catturati dall'utilizzo effettivo di siti web. Una metodologia innovativa di Triple Alignment sincronizza dati visivi, strutturali e di azione per creare una supervisione multimodale completa. I ricercatori hanno sviluppato una pipeline di raccolta scalabile che cattura compiti complessi e di alto valore tipicamente trascurati dai metodi di generazione sintetica. Il dataset consente un approccio Dual Mid-Training che separa il grounding spaziale dai processi di pianificazione. Questo metodo raggiunge metriche di prestazione leader nel nuovo framework di valutazione WebChainBench e in altri benchmark GUI consolidati. Il lavoro fornisce risorse essenziali per sviluppare e testare rigorosamente agenti web scalabili. Tutti i dati e le metodologie sono accessibili apertamente attraverso arXiv.

Fatti principali

  • WebChain contiene 31.725 traiettorie di interazione web annotate da esseri umani
  • Il dataset include 318.000 passaggi di interazione individuali
  • Presenta il Triple Alignment di dati visivi, strutturali e di azione
  • Progettato per accelerare la ricerca riproducibile sugli agenti web
  • Utilizza una pipeline scalabile che cattura compiti complessi del mondo reale
  • Propone una ricetta Dual Mid-Training che disaccoppia il grounding spaziale dalla pianificazione
  • Raggiunge prestazioni all'avanguardia su WebChainBench e altri benchmark GUI
  • Il dataset è open-source e disponibile attraverso arXiv

Entità

Istituzioni

  • arXiv

Fonti