ARTFEED — Contemporary Art Intelligence

Region4Web: Ripensare la Granularità dello Spazio di Osservazione per Agenti Web

other · 2026-05-11

Un nuovo framework chiamato Region4Web propone che gli agenti web dovrebbero percepire le pagine a livello di regioni funzionali piuttosto che di singoli elementi. L'approccio riorganizza l'AXTree in regioni funzionali tramite decomposizione gerarchica e astrazione semantica. Un pipeline di inferenza complementare, PageDigest, fornisce osservazioni a livello di regione come un digest compatto per pagina che persiste tra i passaggi. Il lavoro affronta la scelta progettuale poco esaminata della granularità dello spazio di osservazione negli agenti web, sostenendo che l'osservazione a livello di elemento costringe gli agenti a inferire implicitamente l'organizzazione funzionale. Il framework viene valutato sul benchmark WebArena.

Fatti principali

  • Region4Web riorganizza l'AXTree in regioni funzionali.
  • PageDigest è un pipeline di inferenza specifico per il web per l'osservazione a livello di regione.
  • La granularità dell'osservazione è una scelta progettuale poco esaminata negli agenti web.
  • I lavori esistenti trattano l'osservazione alla stessa granularità a livello di elemento dello spazio delle azioni.
  • Region4Web utilizza decomposizione gerarchica e astrazione semantica.
  • PageDigest fornisce un digest compatto per pagina che persiste tra i passaggi.
  • Il framework viene valutato sul benchmark WebArena.
  • L'articolo è disponibile su arXiv con ID 2605.07134.

Entità

Istituzioni

  • arXiv

Fonti