ARTFEED — Contemporary Art Intelligence

Agent-breakage: un framework di misurazione per operazioni Kubernetes autonome

other · 2026-05-25

Un nuovo articolo su arXiv (2605.23058) introduce agent-breakage, un framework di misurazione a ciclo chiuso per agenti di operazioni Kubernetes autonome. Gli autori sostengono che le affermazioni empiriche su tali agenti sono in gran parte non falsificabili a causa della mancanza di baseline controllate, bias di selezione, assenza di matrici decisionali preregistrate e campioni di piccole dimensioni. Il framework inietta guasti in un cluster Kubernetes target, osserva le risposte degli agenti e le valuta su quattro assi rispetto alla verità di base, accumulando tuple etichettate con esito. Distingue l'errore del framework dall'errore di ragionamento e supporta il test off-condition. Il lavoro mira a fornire un substrato di verifica analogo agli ambienti di test degli agenti di codice.

Fatti principali

  • Articolo arXiv 2605.23058
  • Introduce il framework di misurazione agent-breakage
  • Affronta la non falsificabilità degli agenti di operazioni Kubernetes autonome
  • Inietta guasti in un cluster Kubernetes target
  • Valuta le risposte degli agenti su quattro assi rispetto alla verità di base
  • Distingue l'errore del framework dall'errore di ragionamento
  • Supporta il test off-condition
  • Accumula tuple (stato, azione, esito)

Entità

Istituzioni

  • arXiv

Fonti