PIIGuard: Difesa a livello di pagina web contro la raccolta di PII da parte di assistenti LLM
Un nuovo sistema protettivo chiamato PIIGuard è stato creato da ricercatori per salvaguardare le informazioni personali identificabili (PII) dall'estrazione da parte di assistenti LLM in grado di navigare. A differenza delle precedenti misure protettive che operavano a livello di modello, servizio o agente, PIIGuard funziona direttamente a livello di pagina web utilizzando l'iniezione indiretta di prompt. I proprietari di siti web possono inserire frammenti HTML nascosti appositamente progettati che impediscono agli LLM di rivelare o ricostruire PII di contatto. Il meccanismo valuta le perdite attraverso punteggi basati su regole, mutazione evolutiva e una valutazione finale di recuperabilità. Nei test che hanno coinvolto tre modelli—GPT-5.4-nano, Claude-haiku-4.5 e DeepSeek-chat (ultima v3.2)—PIIGuard ha dimostrato un tasso di successo di difesa di almeno il 97,0%. Questa soluzione offre un modo pratico per i proprietari di siti web di proteggersi dalla raccolta di PII senza alterare i framework LLM o di servizio.
Fatti principali
- PIIGuard è una difesa a livello di pagina web contro la raccolta di PII da parte di assistenti LLM.
- Reimpiega l'iniezione indiretta di prompt come meccanismo protettivo.
- I proprietari di pagine incorporano frammenti HTML nascosti ottimizzati per allontanare gli LLM dalla divulgazione di PII di contatto.
- Il sistema utilizza punteggi di perdita basati su regole, mutazione evolutiva e valutazione di recuperabilità basata su giudice.
- Valutato su GPT-5.4-nano, Claude-haiku-4.5 e DeepSeek-chat (ultima v3.2).
- Ha raggiunto almeno il 97,0% di successo di difesa nella valutazione diretta HTML.
- Le difese precedenti sono implementate a livello di modello, servizio o agente, non a livello di pagina web.
- PIIGuard è progettato per i normali proprietari di pagine con opzioni di implementazione limitate.
Entità
—