ARTFEED — Contemporary Art Intelligence

Sostituzione PII su Dispositivo con Prompting Few-Shot Condizionato dalla Località

ai-technology · 2026-05-14

Un recente articolo di ricerca su arXiv introduce una tecnica innovativa su dispositivo che sostituisce efficacemente le informazioni personali identificabili (PII) con dati fittizi coerenti, corrispondenti ai tipi di dati originali. Questo approccio mira a superare le sfide presentate dai metodi di redazione tradizionali, che possono compromettere i processi di recupero e riconoscimento di entità nominate. Il sistema utilizza un classificatore di token mixture-of-experts da 1,5 miliardi di parametri per identificare le span, insieme a un modello linguistico Bonsai da 1 bit per produrre sostituzioni contestuali di informazioni sensibili. Gli autori sottolineano l'importanza della selezione del prompt, suggerendo che dimostrazioni variabili potrebbero migliorare le prestazioni del modello rispetto a esempi fissi.

Fatti principali

  • L'articolo arXiv 2605.13538 propone una pipeline di sostituzione PII su dispositivo
  • Utilizza il classificatore di token openai/privacy-filter 1.5B MoE per il rilevamento
  • Utilizza il SLM Bonsai-1.7B da 1 bit per la generazione contestuale di surrogati
  • Utilizza un generatore basato su regole faker per campi strutturati
  • Dimostrazioni fisse a tre colpi causano la ripetizione letterale degli output delle dimostrazioni
  • Ternary-Bonsai-1.7B a 1,58 bit mostra gli stessi fallimenti byte-identici
  • Il prompting few-shot rotante condizionato dalla località risolve la ripetizione
  • La scelta del prompt è risultata più importante della quantizzazione

Entità

Istituzioni

  • arXiv
  • openai
  • Bonsai

Fonti