SafeGPT: sistema di protezione contro le fughe di dati nell'uso aziendale dei LLM

ai-technology · 2026-05-18

Un recente studio introduce SafeGPT, un meccanismo di sicurezza a doppio strato volto a impedire la condivisione non autorizzata di informazioni sensibili e risultati non etici quando le aziende utilizzano modelli linguistici di grandi dimensioni (LLM). Questo sistema combina rilevamento e oscuramento sul lato input con moderazione e riformulazione sul lato output, insieme al feedback umano. I risultati sperimentali indicano che SafeGPT riduce significativamente le probabilità di fuga di dati e risultati distorti, mantenendo alta la soddisfazione degli utenti. La ricerca è accessibile su arXiv nella sezione Crittografia e Sicurezza.

Fatti principali

SafeGPT è un sistema di protezione a due lati per l'uso aziendale dei LLM.
Previene la fuga di dati sensibili e output non etici.
Il sistema include rilevamento/oscuramento sul lato input e moderazione/riformulazione sul lato output.
Il feedback umano è integrato in SafeGPT.
Gli esperimenti mostrano una riduzione del rischio di fuga di dati e output distorti.
La soddisfazione degli utenti è mantenuta con SafeGPT.
L'articolo si intitola 'SafeGPT: Preventing Data Leakage and Unethical Outputs in Enterprise LLM Use'.
È pubblicato su arXiv nella sezione Computer Science > Cryptography and Security.

SafeGPT: sistema di protezione contro le fughe di dati nell'uso aziendale dei LLM

Fatti principali

Entità

Istituzioni

Fonti