Region4Web: Ripensare la Granularità dello Spazio di Osservazione per Agenti Web
Un nuovo framework chiamato Region4Web propone che gli agenti web dovrebbero percepire le pagine a livello di regioni funzionali piuttosto che di singoli elementi. L'approccio riorganizza l'AXTree in regioni funzionali tramite decomposizione gerarchica e astrazione semantica. Un pipeline di inferenza complementare, PageDigest, fornisce osservazioni a livello di regione come un digest compatto per pagina che persiste tra i passaggi. Il lavoro affronta la scelta progettuale poco esaminata della granularità dello spazio di osservazione negli agenti web, sostenendo che l'osservazione a livello di elemento costringe gli agenti a inferire implicitamente l'organizzazione funzionale. Il framework viene valutato sul benchmark WebArena.
Fatti principali
- Region4Web riorganizza l'AXTree in regioni funzionali.
- PageDigest è un pipeline di inferenza specifico per il web per l'osservazione a livello di regione.
- La granularità dell'osservazione è una scelta progettuale poco esaminata negli agenti web.
- I lavori esistenti trattano l'osservazione alla stessa granularità a livello di elemento dello spazio delle azioni.
- Region4Web utilizza decomposizione gerarchica e astrazione semantica.
- PageDigest fornisce un digest compatto per pagina che persiste tra i passaggi.
- Il framework viene valutato sul benchmark WebArena.
- L'articolo è disponibile su arXiv con ID 2605.07134.
Entità
Istituzioni
- arXiv