AuthBench: Benchmarking dell'Autorizzazione a Privilegio Minimo negli Agenti di Codifica
Uno studio recente presenta l'inferenza del confine di autorizzazione, in cui un modello correla le istruzioni del compito e gli ambienti terminali a una politica a livello di file per lettura, scrittura ed esecuzione. I ricercatori hanno sviluppato AuthBench, un benchmark composto da 120 compiti terminali realistici, completi di etichette di autorizzazione revisionate da umani e validatori eseguibili per valutare l'utilità e i risultati degli attacchi. I risultati di AuthBench indicano che l'autorizzazione è più complessa del semplice bilanciamento tra approcci conservativi e permissivi: i modelli all'avanguardia spesso trascurano le autorizzazioni necessarie per la catena di esecuzione, consentendo anche l'accesso a risorse inutilizzate o sensibili. Migliorare il ragionamento durante l'inferenza non corregge questa discrepanza. Questa ricerca è disponibile su arXiv con l'identificatore 2605.14859.
Fatti principali
- Gli agenti di codifica richiedono autorizzazione a privilegio minimo per un'implementazione sicura.
- L'inferenza del confine di autorizzazione mappa le istruzioni del compito a politiche a livello di file.
- AuthBench include 120 compiti terminali realistici.
- I compiti hanno etichette di autorizzazione revisionate da umani e validatori eseguibili.
- I modelli all'avanguardia omettono le autorizzazioni richieste e concedono quelle non necessarie.
- Un maggiore ragionamento durante l'inferenza non risolve la discrepanza.
- Lo studio è su arXiv con ID 2605.14859.
- Il tipo di annuncio è cross.
Entità
Istituzioni
- arXiv