I LLM Consentono l'Annotazione di PII Indipendente dalla Tassonomia nel Traffico HTTP

ai-technology · 2026-05-09

Un nuovo articolo su arXiv (2605.06305) propone l'uso di Large Language Models (LLM) per l'annotazione indipendente dalla tassonomia delle Informazioni Personali Identificabili (PII) nel traffico HTTP, affrontando la scarsità di dati etichettati. Il pipeline multi-stadio combina pre-elaborazione deterministica con classificazione e validazione basate su LLM, e include un generatore di traffico sintetico per la valutazione.

Fatti principali

1. ID articolo: arXiv:2605.06305
2. Pubblicato su arXiv
3. Si concentra su audit automatici della privacy di applicazioni web e mobili
4. Analizza il traffico HTTP in uscita per perdite di PII
5. I rilevatori esistenti si basano su traffico manualmente etichettato scarso
6. I rilevatori esistenti sono legati a tassonomie di etichette fisse
7. Propone un pipeline basato su LLM per annotazione indipendente dalla tassonomia
8. Il pipeline include pre-elaborazione deterministica, classificazione a livello di etichetta, annotazione a livello di istanza e validazione dell'output
9. Include un generatore basato su LLM per traffico HTTP sintetico

I LLM Consentono l'Annotazione di PII Indipendente dalla Tassonomia nel Traffico HTTP

Fatti principali

Entità

Istituzioni

Fonti