AuthBench: Benchmarking dell'Autorizzazione a Privilegio Minimo negli Agenti di Codifica

ai-technology · 2026-05-16

Uno studio recente presenta l'inferenza del confine di autorizzazione, in cui un modello correla le istruzioni del compito e gli ambienti terminali a una politica a livello di file per lettura, scrittura ed esecuzione. I ricercatori hanno sviluppato AuthBench, un benchmark composto da 120 compiti terminali realistici, completi di etichette di autorizzazione revisionate da umani e validatori eseguibili per valutare l'utilità e i risultati degli attacchi. I risultati di AuthBench indicano che l'autorizzazione è più complessa del semplice bilanciamento tra approcci conservativi e permissivi: i modelli all'avanguardia spesso trascurano le autorizzazioni necessarie per la catena di esecuzione, consentendo anche l'accesso a risorse inutilizzate o sensibili. Migliorare il ragionamento durante l'inferenza non corregge questa discrepanza. Questa ricerca è disponibile su arXiv con l'identificatore 2605.14859.

Fatti principali

Gli agenti di codifica richiedono autorizzazione a privilegio minimo per un'implementazione sicura.
L'inferenza del confine di autorizzazione mappa le istruzioni del compito a politiche a livello di file.
AuthBench include 120 compiti terminali realistici.
I compiti hanno etichette di autorizzazione revisionate da umani e validatori eseguibili.
I modelli all'avanguardia omettono le autorizzazioni richieste e concedono quelle non necessarie.
Un maggiore ragionamento durante l'inferenza non risolve la discrepanza.
Lo studio è su arXiv con ID 2605.14859.
Il tipo di annuncio è cross.

AuthBench: Benchmarking dell'Autorizzazione a Privilegio Minimo negli Agenti di Codifica

Fatti principali

Entità

Istituzioni

Fonti