Il Framework Aethelgard Propone una Governance Appresa per le Capacità degli Agenti AI Autonomi

ai-technology · 2026-04-15

Un articolo di ricerca presenta Aethelgard, un framework di governance adattiva a quattro strati mirato a implementare il principio del minimo privilegio per gli agenti AI autonomi. Gli autori evidenziano il problema del sovradimensionamento delle capacità, dove gli agenti che utilizzano runtime open-source come OpenClaw rivelano tutti gli strumenti disponibili per ogni sessione, indipendentemente dal compito. Ciò porta a un rapporto di sovradimensionamento di 15 volte, consentendo a un'attività di riassunto di avere gli stessi privilegi di esecuzione shell, generazione di subagenti e accesso alle credenziali di un'attività di distribuzione del codice. Le difese attuali come il sandbox container NemoClaw e lo scanner di abilità Cisco DefenseClaw danno priorità al contenimento e al rilevamento delle minacce, ma non determinano l'insieme essenziale di capacità per vari compiti. Il primo strato di Aethelgard, il Capability Governor, limita dinamicamente gli strumenti accessibili a un agente in ogni sessione, mentre il Layer 3, il Safety Router, utilizza un classificatore ibrido basato su regole e fine-tuned per intercettare le chiamate agli strumenti prima che vengano eseguite. Questo articolo, referenziato come arXiv:2604.11839v1, è stato annunciato come una sottomissione cross-type e propone questa politica appresa come rimedio alle carenze di governance nei sistemi AI autonomi esistenti.

Fatti principali

L'articolo introduce Aethelgard, un framework di governance adattiva a quattro strati per agenti AI autonomi.
Affronta il problema del sovradimensionamento delle capacità, dove gli agenti hanno un rapporto di sovradimensionamento degli strumenti di 15 volte.
I runtime open-source come OpenClaw espongono per impostazione predefinita tutti gli strumenti disponibili a ogni sessione.
Le difese esistenti includono il sandbox container NemoClaw e lo scanner di abilità Cisco DefenseClaw.
Le difese attuali affrontano il contenimento e il rilevamento delle minacce, ma non apprendono gli insiemi minimi vitali di capacità.
Il Layer 1 di Aethelgard è il Capability Governor, che delimita dinamicamente la consapevolezza degli strumenti per sessione.
Il Layer 3 è il Safety Router, che intercetta le chiamate agli strumenti con un classificatore ibrido basato su regole e fine-tuned.
L'articolo è arXiv:2604.11839v1, annunciato come una sottomissione cross-type.

Il Framework Aethelgard Propone una Governance Appresa per le Capacità degli Agenti AI Autonomi

Fatti principali

Entità

Istituzioni

Fonti