ARTFEED — Contemporary Art Intelligence

Proposta di Paradigma Pianifica-Esegui per Agenti Web

other · 2026-05-16

Un recente articolo su arXiv suggerisce che gli agenti web dovrebbero adottare un approccio pianifica-esegui anziché il comunemente utilizzato framework ReAct. I ricercatori sostengono che l'integrazione di informazioni web non verificate nei processi decisionali di ReAct apre una vulnerabilità a iniezioni di prompt che possono manipolare il flusso di controllo dell'agente. Al contrario, il metodo pianifica-esegui stabilisce un programma specifico per il compito prima di interagire con contenuti web in tempo reale, proteggendo così da informazioni non attendibili che alterano i compiti dell'utente o spingono il modello a creare nuove azioni. Lo studio valuta WebArena, un noto benchmark per agenti web, concludendo che tutti i compiti sono allineati con l'approccio proposto.

Fatti principali

  • L'articolo sostiene che gli agenti web dovrebbero adottare pianifica-esegui invece di ReAct.
  • ReAct permette a contenuti web non attendibili di influenzare le azioni dell'agente.
  • Pianifica-esegui si impegna in un programma prima di osservare i contenuti in esecuzione.
  • I dati non attendibili possono influenzare solo valori o rami all'interno di un grafo predefinito.
  • L'analisi di WebArena mostra che tutti i compiti sono compatibili con pianifica-esegui.
  • L'articolo è su arXiv con ID 2605.14290.

Entità

Istituzioni

  • arXiv

Fonti