ExploitBench: Benchmark a Scaletta di Capacità per Agenti LLM di Cybersicurezza

other · 2026-05-16

ExploitBench è uno strumento innovativo che valuta lo sfruttamento attraverso 16 fattori misurabili, come copertura, crash, capacità sandbox, lettura/scrittura arbitraria, hijacking del flusso di controllo ed esecuzione di codice arbitrario. Ogni caratteristica è verificata da un metodo affidabile che impiega sfide casuali per testare i primitivi e confronta gli output con binari noti, più una prova per l'esecuzione del codice tramite gestione dei segnali. Questo benchmark prende di mira 41 vulnerabilità in V8 a causa della sua popolarità. A differenza degli attuali benchmark di sicurezza per LLM, che considerano un crash come uno sfruttamento riuscito, ExploitBench vede lo sfruttamento più come una serie di passaggi, evolvendo dalla semplice esecuzione di una linea di codice difettosa al pieno controllo del sistema target.

Fatti principali

1. ExploitBench scompone lo sfruttamento in 16 flag misurabili.
2. I flag includono copertura, crash, primitivi sandbox, lettura/scrittura arbitraria, hijack del flusso di controllo ed esecuzione di codice arbitrario.
3. Ogni capacità è verificata da un oracolo deterministico.
4. L'oracolo utilizza una sfida-risposta randomizzata per esecuzione per i primitivi.
5. L'esecuzione differenziale rispetto a binari di verità misura il progresso.
6. Una prova tramite gestore di segnali è usata per l'esecuzione del codice.
7. ExploitBench è istanziato su 41 bug di V8.
8. Gli attuali benchmark di sicurezza per LLM trattano un crash come successo dello sfruttamento.

Entità

—

Fonti

arXiv cs.AI — 2026-05-16