Agent-breakage: un framework di misurazione per operazioni Kubernetes autonome
Un nuovo articolo su arXiv (2605.23058) introduce agent-breakage, un framework di misurazione a ciclo chiuso per agenti di operazioni Kubernetes autonome. Gli autori sostengono che le affermazioni empiriche su tali agenti sono in gran parte non falsificabili a causa della mancanza di baseline controllate, bias di selezione, assenza di matrici decisionali preregistrate e campioni di piccole dimensioni. Il framework inietta guasti in un cluster Kubernetes target, osserva le risposte degli agenti e le valuta su quattro assi rispetto alla verità di base, accumulando tuple etichettate con esito. Distingue l'errore del framework dall'errore di ragionamento e supporta il test off-condition. Il lavoro mira a fornire un substrato di verifica analogo agli ambienti di test degli agenti di codice.
Fatti principali
- Articolo arXiv 2605.23058
- Introduce il framework di misurazione agent-breakage
- Affronta la non falsificabilità degli agenti di operazioni Kubernetes autonome
- Inietta guasti in un cluster Kubernetes target
- Valuta le risposte degli agenti su quattro assi rispetto alla verità di base
- Distingue l'errore del framework dall'errore di ragionamento
- Supporta il test off-condition
- Accumula tuple (stato, azione, esito)
Entità
Istituzioni
- arXiv