Ingegneria dell'AI Harness: Substrato Runtime per Agenti Basati su Modelli Fondamentali
Un nuovo studio su arXiv (2605.13357) suggerisce che le sfide affrontate dagli agenti software autonomi inaffidabili riguardano più il loro ambiente runtime che i modelli stessi. Gli autori introducono un concetto chiamato 'Ingegneria dell'AI Harness', che delinea come un agente basato su modello fondamentale interagisca attraverso osservazione, azioni, feedback e completamento di compiti. Evidenziano undici ruoli essenziali, tra cui definire compiti, selezionare il contesto, accedere agli strumenti e gestire la memoria del progetto, tra gli altri. Per migliorare il supporto runtime per questi agenti, propongono un sistema a quattro livelli noto come scala harness (H0-H3) e un modo per tracciare eventuali interventi effettuati durante il processo.
Fatti principali
- Articolo pubblicato su arXiv con identificatore 2605.13357
- Titolo: Ingegneria dell'AI Harness: Un Substrato Runtime per Agenti Software Basati su Modelli Fondamentali
- Gli autori sostengono che la capacità di ingegneria software emerga da un sistema modello-harness-ambiente
- L'harness media osservazione, azione, feedback e completamento per gli agenti basati su modelli fondamentali
- Sono identificate undici responsabilità componenti
- Viene proposta una scala harness a quattro livelli (H0-H3)
- Viene introdotto un meccanismo di tracciamento per la registrazione degli interventi
- Il tipo di annuncio è cross
Entità
Istituzioni
- arXiv