PRISM: Difesa in Tempo Reale contro la Perdita di Segreti nei Sistemi LLM Multi-Agente

other · 2026-05-12

Un nuovo articolo di ricerca su arXiv introduce PRISM, un meccanismo di difesa in tempo reale per sistemi LLM multi-agente che rileva e mitiga la perdita di segreti durante la generazione del testo. Gli autori formalizzano l'"amplificazione di propagazione", per cui informazioni sensibili accessibili da un agente possono diffondersi attraverso il contesto condiviso verso output a valle. Le difese esistenti come le salvaguardie basate su prompt e il pattern matching statico sono inadeguate per questo scenario. PRISM tratta la perdita di credenziali come un problema di accumulo sequenziale del rischio, combinando 16 segnali a ogni passo di decodifica per identificare e bloccare le perdite prima che si verifichino. L'articolo è disponibile su arXiv:2605.10614.

Fatti principali

PRISM è una difesa in tempo reale per sistemi LLM multi-agente.
Affronta l'amplificazione di propagazione delle informazioni sensibili.
Combina 16 segnali a ogni passo di decodifica.
Le difese esistenti non sono progettate per contesti multi-agente.
Articolo pubblicato su arXiv con ID 2605.10614.
Tratta la perdita come accumulo sequenziale del rischio.
Opera durante la generazione, non dopo.
Mira a prevenire la perdita di segreti senza intento avversario esplicito.

PRISM: Difesa in Tempo Reale contro la Perdita di Segreti nei Sistemi LLM Multi-Agente

Fatti principali

Entità

Istituzioni

Fonti