ARTFEED — Contemporary Art Intelligence

Ingegneria Automatizzata di Harness per Agenti AI

ai-technology · 2026-04-25

Un recente preprint su arXiv (2604.21003) presenta un sistema a due livelli progettato per automatizzare la creazione di harness per agenti AI, che comprendono prompt, strumenti, logica di orchestrazione e metriche di valutazione essenziali per ottimizzare i modelli di base in flussi di lavoro complessi e specializzati. Al centro di questo framework c'è il Ciclo di Evoluzione dell'Harness, che perfeziona l'harness di un agente lavoratore per compiti specifici. In questa configurazione, un Agente Lavoratore esegue il compito, un Agente Valutatore analizza criticamente i fallimenti e valuta le prestazioni, mentre un Agente di Evoluzione adatta l'harness in base a queste valutazioni. Questa innovazione mira a ridurre il lavoro manuale e specialistico attualmente necessario per lo sviluppo di harness in vari domini applicativi, tra cui la navigazione di applicazioni web aziendali e l'automazione delle revisioni del codice.

Fatti principali

  • Il preprint arXiv 2604.21003 propone l'ingegneria automatizzata di harness per agenti AI.
  • Il framework ha due livelli: Ciclo di Evoluzione dell'Harness e un secondo livello non specificato.
  • Il Ciclo di Evoluzione dell'Harness coinvolge agenti Lavoratore, Valutatore e di Evoluzione.
  • Il Valutatore diagnostica in modo avversariale i fallimenti e assegna punteggi alle prestazioni.
  • L'agente Lavoratore esegue il compito utilizzando un harness.
  • L'agente di Evoluzione modifica l'harness in base alla valutazione.
  • Si rivolge a flussi di lavoro complessi specifici del dominio come app web aziendali e pipeline di ricerca.
  • Mira a sostituire la laboriosa ingegneria manuale degli harness per ogni nuovo compito.

Entità

Istituzioni

  • arXiv

Fonti