ARTFEED — Contemporary Art Intelligence

La compilazione JIT dell'agente riduce la latenza nella pianificazione degli agenti web

ai-technology · 2026-05-22

Una nuova tecnica nota come compilazione just-in-time (JIT) dell'agente mira a ridurre al minimo la latenza negli agenti computer-use (CUA) che facilitano le attività del browser, come effettuare ordini da Taco Bell. I sistemi esistenti si basano su un ciclo sequenziale fetch-screenshot-execute, che richiede una chiamata LLM per ogni iterazione, portando a una maggiore latenza e potenziali errori. Al contrario, la compilazione JIT trasforma le descrizioni delle attività in codice eseguibile che comprende chiamate LLM, chiamate a strumenti ed elaborazione parallela. Questo metodo comprende tre elementi: JIT-Planner, che genera e convalida più piani di codice per identificare l'opzione a costo più basso; JIT-Scheduler, che valuta i metodi di parallelizzazione utilizzando la stima dei costi Monte Carlo; e un protocollo che impone l'uso corretto degli strumenti. La ricerca è disponibile su arXiv con ID 2605.21470.

Fatti principali

  • La compilazione JIT dell'agente compila le descrizioni delle attività in codice eseguibile.
  • Le attuali implementazioni CUA utilizzano un ciclo sequenziale fetch-screenshot-execute.
  • JIT-Planner genera e convalida più piani di codice.
  • JIT-Scheduler utilizza la stima dei costi Monte Carlo per la parallelizzazione.
  • Un protocollo degli strumenti che impone invarianti fa parte del metodo.
  • L'approccio mira a ridurre la latenza e gli errori negli agenti web.
  • L'articolo è su arXiv con ID 2605.21470.
  • Esempio di attività: ordinare l'articolo più economico da Taco Bell.

Entità

Istituzioni

  • arXiv

Fonti