Il Filtro Privacy di OpenAI Alimenta Tre App Web Scalabili
OpenAI ha rilasciato un modello Filtro Privacy (1,5 miliardi di parametri, 50 milioni attivi, Apache 2.0) che rileva categorie di PII tra cui private_person, private_address, private_email, private_phone, private_url, private_date, account_number e secret, con un contesto di 128.000 token. Tre app web demo costruite con gr.Server di Gradio ne mostrano le capacità: Document Privacy Explorer (ysharma/OPF-Document-PII-Explorer) evidenzia le porzioni di PII in PDF o DOCX caricati con un filtro laterale e un dashboard riassuntivo; Image Anonymizer (ysharma/OPF-Image-Anonymizer) oscura le PII nelle immagini con barre nere, consentendo attivazione, trascinamento e annotazione manuale su una tela; SmartRedact Paste (ysharma/OPF-SmartRedact-Paste) fornisce un pastebin che restituisce un URL pubblico oscurato con segnaposto e un URL di rivelazione privato con token. Tutte le app utilizzano @server.api per gli endpoint del modello, sfruttando la coda di Gradio, l'allocazione ZeroGPU e l'SDK gradio_client. Il modello raggiunge lo stato dell'arte sul benchmark PII-Masking-300k ed è concesso in licenza Apache 2.0.
Fatti principali
- Privacy Filter è un modello da 1,5 miliardi di parametri con 50 milioni di parametri attivi.
- Il modello è concesso in licenza Apache 2.0.
- Categorie PII: private_person, private_address, private_email, private_phone, private_url, private_date, account_number, secret.
- La lunghezza del contesto è di 128.000 token.
- Raggiunge lo stato dell'arte sul benchmark PII-Masking-300k.
- Document Privacy Explorer su ysharma/OPF-Document-PII-Explorer.
- Image Anonymizer su ysharma/OPF-Image-Anonymizer.
- SmartRedact Paste su ysharma/OPF-SmartRedact-Paste.
Entità
Istituzioni
- OpenAI
- Gradio
- Hugging Face