Proposta di Paradigma Pianifica-Esegui per Agenti Web
Un recente articolo su arXiv suggerisce che gli agenti web dovrebbero adottare un approccio pianifica-esegui anziché il comunemente utilizzato framework ReAct. I ricercatori sostengono che l'integrazione di informazioni web non verificate nei processi decisionali di ReAct apre una vulnerabilità a iniezioni di prompt che possono manipolare il flusso di controllo dell'agente. Al contrario, il metodo pianifica-esegui stabilisce un programma specifico per il compito prima di interagire con contenuti web in tempo reale, proteggendo così da informazioni non attendibili che alterano i compiti dell'utente o spingono il modello a creare nuove azioni. Lo studio valuta WebArena, un noto benchmark per agenti web, concludendo che tutti i compiti sono allineati con l'approccio proposto.
Fatti principali
- L'articolo sostiene che gli agenti web dovrebbero adottare pianifica-esegui invece di ReAct.
- ReAct permette a contenuti web non attendibili di influenzare le azioni dell'agente.
- Pianifica-esegui si impegna in un programma prima di osservare i contenuti in esecuzione.
- I dati non attendibili possono influenzare solo valori o rami all'interno di un grafo predefinito.
- L'analisi di WebArena mostra che tutti i compiti sono compatibili con pianifica-esegui.
- L'articolo è su arXiv con ID 2605.14290.
Entità
Istituzioni
- arXiv