Il Framework Aethelgard Propone una Governance Appresa per le Capacità degli Agenti AI Autonomi
Un articolo di ricerca presenta Aethelgard, un framework di governance adattiva a quattro strati mirato a implementare il principio del minimo privilegio per gli agenti AI autonomi. Gli autori evidenziano il problema del sovradimensionamento delle capacità, dove gli agenti che utilizzano runtime open-source come OpenClaw rivelano tutti gli strumenti disponibili per ogni sessione, indipendentemente dal compito. Ciò porta a un rapporto di sovradimensionamento di 15 volte, consentendo a un'attività di riassunto di avere gli stessi privilegi di esecuzione shell, generazione di subagenti e accesso alle credenziali di un'attività di distribuzione del codice. Le difese attuali come il sandbox container NemoClaw e lo scanner di abilità Cisco DefenseClaw danno priorità al contenimento e al rilevamento delle minacce, ma non determinano l'insieme essenziale di capacità per vari compiti. Il primo strato di Aethelgard, il Capability Governor, limita dinamicamente gli strumenti accessibili a un agente in ogni sessione, mentre il Layer 3, il Safety Router, utilizza un classificatore ibrido basato su regole e fine-tuned per intercettare le chiamate agli strumenti prima che vengano eseguite. Questo articolo, referenziato come arXiv:2604.11839v1, è stato annunciato come una sottomissione cross-type e propone questa politica appresa come rimedio alle carenze di governance nei sistemi AI autonomi esistenti.
Fatti principali
- L'articolo introduce Aethelgard, un framework di governance adattiva a quattro strati per agenti AI autonomi.
- Affronta il problema del sovradimensionamento delle capacità, dove gli agenti hanno un rapporto di sovradimensionamento degli strumenti di 15 volte.
- I runtime open-source come OpenClaw espongono per impostazione predefinita tutti gli strumenti disponibili a ogni sessione.
- Le difese esistenti includono il sandbox container NemoClaw e lo scanner di abilità Cisco DefenseClaw.
- Le difese attuali affrontano il contenimento e il rilevamento delle minacce, ma non apprendono gli insiemi minimi vitali di capacità.
- Il Layer 1 di Aethelgard è il Capability Governor, che delimita dinamicamente la consapevolezza degli strumenti per sessione.
- Il Layer 3 è il Safety Router, che intercetta le chiamate agli strumenti con un classificatore ibrido basato su regole e fine-tuned.
- L'articolo è arXiv:2604.11839v1, annunciato come una sottomissione cross-type.
Entità
Istituzioni
- Cisco