SafeGPT: sistema di protezione contro le fughe di dati nell'uso aziendale dei LLM
Un recente studio introduce SafeGPT, un meccanismo di sicurezza a doppio strato volto a impedire la condivisione non autorizzata di informazioni sensibili e risultati non etici quando le aziende utilizzano modelli linguistici di grandi dimensioni (LLM). Questo sistema combina rilevamento e oscuramento sul lato input con moderazione e riformulazione sul lato output, insieme al feedback umano. I risultati sperimentali indicano che SafeGPT riduce significativamente le probabilità di fuga di dati e risultati distorti, mantenendo alta la soddisfazione degli utenti. La ricerca è accessibile su arXiv nella sezione Crittografia e Sicurezza.
Fatti principali
- SafeGPT è un sistema di protezione a due lati per l'uso aziendale dei LLM.
- Previene la fuga di dati sensibili e output non etici.
- Il sistema include rilevamento/oscuramento sul lato input e moderazione/riformulazione sul lato output.
- Il feedback umano è integrato in SafeGPT.
- Gli esperimenti mostrano una riduzione del rischio di fuga di dati e output distorti.
- La soddisfazione degli utenti è mantenuta con SafeGPT.
- L'articolo si intitola 'SafeGPT: Preventing Data Leakage and Unethical Outputs in Enterprise LLM Use'.
- È pubblicato su arXiv nella sezione Computer Science > Cryptography and Security.
Entità
Istituzioni
- arXiv