ARTFEED — Contemporary Art Intelligence

Agente di Apprendimento per Rinforzo Online per la Navigazione Web

other · 2026-05-01

Un nuovo articolo di ricerca introduce OpAgent, un agente web autonomo che utilizza l'apprendimento per rinforzo online per navigare in siti web reali. A differenza dei metodi convenzionali che si basano su dataset statici e fine-tuning supervisionato, OpAgent apprende attraverso interazioni iterative dirette con ambienti web non vincolati. L'approccio prevede un fine-tuning multi-task gerarchico con dataset categorizzati in primitive di Pianificazione, Azione e Ancoraggio, stabilendo un Modello Visione-Linguaggio con forti capacità di seguire le istruzioni. Questo affronta i cambiamenti distribuzionali causati da traiettorie offline che non riescono a catturare transizioni di stato stocastiche e feedback in tempo reale.

Fatti principali

  • Titolo dell'articolo: OpAgent: Agente Operatore per la Navigazione Web
  • ID arXiv: 2602.13559v2
  • Propone l'apprendimento per rinforzo online per agenti web
  • Utilizza fine-tuning multi-task gerarchico
  • Dataset categorizzati per primitive funzionali: Pianificazione, Azione, Ancoraggio
  • Basato su Modello Visione-Linguaggio
  • Affronta il cambiamento distribuzionale dei metodi offline
  • Apprende attraverso interazioni iterative dirette con i siti web

Entità

Istituzioni

  • arXiv

Fonti