ARTFEED — Contemporary Art Intelligence

MCPHunt: Benchmarking della Perdita di Credenziali in Agenti MCP Multi-Server

ai-technology · 2026-05-01

Un nuovo benchmark chiamato MCPHunt è stato sviluppato dai ricercatori per identificare la propagazione non avversaria delle credenziali attraverso i confini di fiducia di server MCP (Model Context Protocol) multipli. Questo framework affronta una sfida di controllo del flusso di informazioni, dove permessi di lettura/scrittura benigni possono involontariamente far trapelare credenziali tra server a causa di effetti strutturali piuttosto che di intenti malevoli. MCPHunt presenta tre innovazioni chiave: (1) tracciamento delle macchie basato su canary che semplifica il rilevamento della propagazione a un semplice matching di stringhe; (2) un ambiente controllato che include scenari rischiosi, benigni e hard-negative per garantire l'integrità della pipeline e gestire problemi di formato delle credenziali; e (3) CRS (Credential Risk Stratification), che differenzia tra propagazione necessaria per il compito e violazione delle policy. Questo benchmark si concentra sull'isolamento della perdita di credenziali testuali, gettando le basi per valutare la propagazione dei dati tra confini in sistemi multi-server. Lo studio è accessibile su arXiv, ID 2604.27819.

Fatti principali

  • MCPHunt è il primo benchmark controllato per la propagazione non avversaria delle credenziali in agenti MCP multi-server.
  • Il benchmark utilizza il tracciamento delle macchie basato su canary per un matching oggettivo delle stringhe.
  • Include condizioni rischiose, benigne e hard-negative per validare la solidità della pipeline.
  • La stratificazione CRS separa la propagazione delle credenziali necessaria per il compito da quella che viola le policy.
  • Il lavoro affronta problemi di controllo del flusso informativo nella composizione di strumenti.
  • La perdita di credenziali è descritta come un effetto collaterale strutturale della topologia del flusso di lavoro.
  • L'articolo è pubblicato su arXiv con ID 2604.27819.
  • Il framework si concentra sulla propagazione testuale delle credenziali attraverso i confini di fiducia.

Entità

Istituzioni

  • arXiv

Fonti