Agente di Apprendimento per Rinforzo Online per la Navigazione Web
Un nuovo articolo di ricerca introduce OpAgent, un agente web autonomo che utilizza l'apprendimento per rinforzo online per navigare in siti web reali. A differenza dei metodi convenzionali che si basano su dataset statici e fine-tuning supervisionato, OpAgent apprende attraverso interazioni iterative dirette con ambienti web non vincolati. L'approccio prevede un fine-tuning multi-task gerarchico con dataset categorizzati in primitive di Pianificazione, Azione e Ancoraggio, stabilendo un Modello Visione-Linguaggio con forti capacità di seguire le istruzioni. Questo affronta i cambiamenti distribuzionali causati da traiettorie offline che non riescono a catturare transizioni di stato stocastiche e feedback in tempo reale.
Fatti principali
- Titolo dell'articolo: OpAgent: Agente Operatore per la Navigazione Web
- ID arXiv: 2602.13559v2
- Propone l'apprendimento per rinforzo online per agenti web
- Utilizza fine-tuning multi-task gerarchico
- Dataset categorizzati per primitive funzionali: Pianificazione, Azione, Ancoraggio
- Basato su Modello Visione-Linguaggio
- Affronta il cambiamento distribuzionale dei metodi offline
- Apprende attraverso interazioni iterative dirette con i siti web
Entità
Istituzioni
- arXiv