MCPHunt: Benchmarking della Perdita di Credenziali in Agenti MCP Multi-Server
Un nuovo benchmark chiamato MCPHunt è stato sviluppato dai ricercatori per identificare la propagazione non avversaria delle credenziali attraverso i confini di fiducia di server MCP (Model Context Protocol) multipli. Questo framework affronta una sfida di controllo del flusso di informazioni, dove permessi di lettura/scrittura benigni possono involontariamente far trapelare credenziali tra server a causa di effetti strutturali piuttosto che di intenti malevoli. MCPHunt presenta tre innovazioni chiave: (1) tracciamento delle macchie basato su canary che semplifica il rilevamento della propagazione a un semplice matching di stringhe; (2) un ambiente controllato che include scenari rischiosi, benigni e hard-negative per garantire l'integrità della pipeline e gestire problemi di formato delle credenziali; e (3) CRS (Credential Risk Stratification), che differenzia tra propagazione necessaria per il compito e violazione delle policy. Questo benchmark si concentra sull'isolamento della perdita di credenziali testuali, gettando le basi per valutare la propagazione dei dati tra confini in sistemi multi-server. Lo studio è accessibile su arXiv, ID 2604.27819.
Fatti principali
- MCPHunt è il primo benchmark controllato per la propagazione non avversaria delle credenziali in agenti MCP multi-server.
- Il benchmark utilizza il tracciamento delle macchie basato su canary per un matching oggettivo delle stringhe.
- Include condizioni rischiose, benigne e hard-negative per validare la solidità della pipeline.
- La stratificazione CRS separa la propagazione delle credenziali necessaria per il compito da quella che viola le policy.
- Il lavoro affronta problemi di controllo del flusso informativo nella composizione di strumenti.
- La perdita di credenziali è descritta come un effetto collaterale strutturale della topologia del flusso di lavoro.
- L'articolo è pubblicato su arXiv con ID 2604.27819.
- Il framework si concentra sulla propagazione testuale delle credenziali attraverso i confini di fiducia.
Entità
Istituzioni
- arXiv