ARTFEED — Contemporary Art Intelligence

AuthBench: Benchmarking dell'Autorizzazione a Privilegio Minimo negli Agenti di Codifica

ai-technology · 2026-05-16

Uno studio recente presenta l'inferenza del confine di autorizzazione, in cui un modello correla le istruzioni del compito e gli ambienti terminali a una politica a livello di file per lettura, scrittura ed esecuzione. I ricercatori hanno sviluppato AuthBench, un benchmark composto da 120 compiti terminali realistici, completi di etichette di autorizzazione revisionate da umani e validatori eseguibili per valutare l'utilità e i risultati degli attacchi. I risultati di AuthBench indicano che l'autorizzazione è più complessa del semplice bilanciamento tra approcci conservativi e permissivi: i modelli all'avanguardia spesso trascurano le autorizzazioni necessarie per la catena di esecuzione, consentendo anche l'accesso a risorse inutilizzate o sensibili. Migliorare il ragionamento durante l'inferenza non corregge questa discrepanza. Questa ricerca è disponibile su arXiv con l'identificatore 2605.14859.

Fatti principali

  • Gli agenti di codifica richiedono autorizzazione a privilegio minimo per un'implementazione sicura.
  • L'inferenza del confine di autorizzazione mappa le istruzioni del compito a politiche a livello di file.
  • AuthBench include 120 compiti terminali realistici.
  • I compiti hanno etichette di autorizzazione revisionate da umani e validatori eseguibili.
  • I modelli all'avanguardia omettono le autorizzazioni richieste e concedono quelle non necessarie.
  • Un maggiore ragionamento durante l'inferenza non risolve la discrepanza.
  • Lo studio è su arXiv con ID 2605.14859.
  • Il tipo di annuncio è cross.

Entità

Istituzioni

  • arXiv

Fonti