Divario Autorizzazione-Esecuzione: Un Grave Problema di Sicurezza per gli Agenti AI Open-World
Un recente position paper disponibile su arXiv (2605.11003) evidenzia il Divario Autorizzazione-Esecuzione (AEG) come un difetto significativo nella sicurezza e protezione degli agenti open-world. L'AEG si riferisce alla discrepanza tra l'autorizzazione prevista da un principale e le azioni effettivamente eseguite da un agente. Poiché questi agenti operano in modo indipendente attraverso vari strumenti, mantengono stati persistenti e subiscono transizioni multi-agente, anche piccole discrepanze di autorizzazione possono portare a conseguenze gravi e irreversibili. Il documento delinea tre cause fondamentali dell'AEG: incompletezza a livello di delega, corruzione a livello di canale e frammentazione a livello di composizione. Gli autori sottolineano che affrontare solo i sintomi è insufficiente e sostengono la necessità di concentrarsi sulla diagnosi e difesa delle cause profonde per migliorare la sicurezza e la protezione degli agenti.
Fatti principali
- Il Divario Autorizzazione-Esecuzione (AEG) è definito come la divergenza tra l'autorizzazione prevista e l'esecuzione effettiva.
- Gli agenti open-world agiscono autonomamente attraverso strumenti, stato persistente e passaggi multi-agente.
- Tre fonti strutturali dell'AEG: incompletezza a livello di delega, corruzione a livello di canale, frammentazione a livello di composizione.
- Piccole istanze di divergenza di autorizzazione possono causare danni difficili o impossibili da riparare.
- Lo stesso fallimento osservato può derivare da una qualsiasi delle tre fonti strutturali.
- Le difese mirate solo ai sintomi non possono affrontare la causa sottostante.
- Il documento enfatizza la diagnosi e la difesa orientate alla fonte.
- Pubblicato su arXiv con identificatore 2605.11003.
Entità
Istituzioni
- arXiv