ARTFEED — Contemporary Art Intelligence

OpenAI Lancia Privacy Filter, Modello AI per il Rilevamento e la Redazione di Dati Personali

ai-technology · 2026-04-22

OpenAI ha lanciato Privacy Filter, un modello open-weight progettato per rilevare e mascherare le informazioni personalmente identificabili nel testo. Il modello raggiunge prestazioni all'avanguardia con un punteggio F1 del 97,43% sul benchmark corretto PII-Masking-300k. Con 1,5 miliardi di parametri totali e 50 milioni di parametri attivi, Privacy Filter supporta lunghezze di contesto fino a 128.000 token e opera localmente per mantenere i dati sensibili sul dispositivo. Identifica otto categorie di informazioni private, inclusi numeri di conto, segreti, identificatori personali, dettagli di contatto, indirizzi e date private. Il modello di classificazione token bidirezionale utilizza il decodificatore di intervalli con tag BIOES per limiti di mascheramento coerenti. Disponibile con licenza Apache 2.0 su Hugging Face e GitHub, gli sviluppatori possono affinare il modello per casi d'uso specifici nelle pipeline di addestramento, indicizzazione, registrazione e revisione. OpenAI ha sviluppato Privacy Filter attraverso un processo multi-fase che include la definizione della tassonomia della privacy, la conversione del modello da checkpoint pre-addestrati e l'addestramento su dati pubblici e sintetici misti. Il rilascio mira a rafforzare le protezioni della privacy negli ecosistemi AI, pur riconoscendo limitazioni nei domini ad alta sensibilità che richiedono revisione umana.

Fatti principali

  • OpenAI ha rilasciato Privacy Filter il 16 aprile 2026
  • Il modello raggiunge un punteggio F1 del 97,43% sul benchmark corretto PII-Masking-300k
  • Supporta lunghezze di contesto fino a 128.000 token
  • Ha 1,5 miliardi di parametri totali con 50 milioni di parametri attivi
  • Rileva otto categorie di informazioni personalmente identificabili
  • Opera localmente per mantenere i dati non filtrati sul dispositivo
  • Disponibile con licenza Apache 2.0 su Hugging Face e GitHub
  • Progettato per flussi di lavoro ad alta produttività per la privacy

Entità

Istituzioni

  • OpenAI
  • Hugging Face
  • GitHub

Fonti