GRIEF Fuzzer Scopre 15 Vulnerabilità nei Sistemi di Servizio LLM
Un team di ricercatori ha presentato GRIEF, un fuzzer greybox progettato per motori di inferenza LLM che identifica vulnerabilità legate al comportamento di stato condiviso nei layer di servizio. A differenza delle valutazioni tradizionali che si concentrano sulla sicurezza del modello o sulla correttezza delle API, GRIEF considera tracce di richieste multiple temporizzate come input primari, impiegando oracoli leggeri per scoprire crash, blocchi, anomalie prestazionali e corruzione silenziosa dell'output. I guasti riproducibili vengono validati tramite replay controllato con controlli di log-probabilità. Nei test iniziali su vLLM e SGLang, GRIEF ha identificato 15 vulnerabilità, di cui 10 verificate dagli sviluppatori del motore, incluse 2 CVE. Queste vulnerabilità riguardano problemi relativi a KV-cache, batching, condivisione dei prefissi, decodifica speculativa, adattatori e scheduling multi-tenant, sottolineando gli aspetti critici per la sicurezza dell'infrastruttura di servizio LLM sotto carichi di lavoro concorrenti realistici.
Fatti principali
- GRIEF è un fuzzer greybox per motori di inferenza LLM.
- Prende di mira vulnerabilità nel layer di servizio, non nel comportamento del modello.
- Utilizza tracce di richieste multiple temporizzate come input di prima classe.
- Oracoli leggeri rilevano crash, blocchi, patologie prestazionali e corruzione silenziosa dell'output.
- Il replay controllato con controlli di log-probabilità conferma i guasti riproducibili.
- Le campagne iniziali su vLLM e SGLang hanno scoperto 15 vulnerabilità.
- 10 vulnerabilità sono state confermate dagli sviluppatori del motore.
- 2 CVE erano incluse tra le vulnerabilità confermate.
- Le vulnerabilità spaziano su KV-cache, batching, condivisione dei prefissi, decodifica speculativa, adattatori e scheduling multi-tenant.
- Il lavoro sottolinea la natura critica per la sicurezza dei sistemi di servizio LLM.
Entità
Istituzioni
- arXiv