MCPHunt: Benchmarking della Perdita di Credenziali in Agenti MCP Multi-Server

ai-technology · 2026-05-01

Un nuovo benchmark chiamato MCPHunt è stato sviluppato dai ricercatori per identificare la propagazione non avversaria delle credenziali attraverso i confini di fiducia di server MCP (Model Context Protocol) multipli. Questo framework affronta una sfida di controllo del flusso di informazioni, dove permessi di lettura/scrittura benigni possono involontariamente far trapelare credenziali tra server a causa di effetti strutturali piuttosto che di intenti malevoli. MCPHunt presenta tre innovazioni chiave: (1) tracciamento delle macchie basato su canary che semplifica il rilevamento della propagazione a un semplice matching di stringhe; (2) un ambiente controllato che include scenari rischiosi, benigni e hard-negative per garantire l'integrità della pipeline e gestire problemi di formato delle credenziali; e (3) CRS (Credential Risk Stratification), che differenzia tra propagazione necessaria per il compito e violazione delle policy. Questo benchmark si concentra sull'isolamento della perdita di credenziali testuali, gettando le basi per valutare la propagazione dei dati tra confini in sistemi multi-server. Lo studio è accessibile su arXiv, ID 2604.27819.

Fatti principali

MCPHunt è il primo benchmark controllato per la propagazione non avversaria delle credenziali in agenti MCP multi-server.
Il benchmark utilizza il tracciamento delle macchie basato su canary per un matching oggettivo delle stringhe.
Include condizioni rischiose, benigne e hard-negative per validare la solidità della pipeline.
La stratificazione CRS separa la propagazione delle credenziali necessaria per il compito da quella che viola le policy.
Il lavoro affronta problemi di controllo del flusso informativo nella composizione di strumenti.
La perdita di credenziali è descritta come un effetto collaterale strutturale della topologia del flusso di lavoro.
L'articolo è pubblicato su arXiv con ID 2604.27819.
Il framework si concentra sulla propagazione testuale delle credenziali attraverso i confini di fiducia.

MCPHunt: Benchmarking della Perdita di Credenziali in Agenti MCP Multi-Server

Fatti principali

Entità

Istituzioni

Fonti