OpenAI dettaglia le misure di prevenzione della violenza per ChatGPT

ai-technology · 2026-04-29

OpenAI ha pubblicato un post sul blog il 23 aprile 2026, delineando il suo impegno per la sicurezza della comunità e dettagliando le misure per prevenire l'uso improprio di ChatGPT per violenza o danni. L'azienda addestra i modelli a rifiutare richieste di istruzioni che potrebbero abilitare violenza, consentendo al contempo discussioni neutre ed educative. Ha ampliato le salvaguardie per riconoscere segnali di allarme sottili in conversazioni lunghe e contesti diversi. I sistemi di rilevamento automatico analizzano i contenuti e il comportamento degli utenti utilizzando classificatori, modelli di ragionamento, hash-matching e blocklist. Gli account segnalati vengono esaminati da personale umano addestrato nel rispetto delle garanzie sulla privacy. Le violazioni portano alla revoca immediata dell'account con una politica di tolleranza zero. In caso di rischio credibile imminente, OpenAI informa le forze dell'ordine. I controlli parentali introdotti nell'autunno 2025 consentono ai genitori di personalizzare le impostazioni per gli adolescenti, con notifiche automatiche in rari casi di disagio. Una funzione di contatto fidato consentirà presto agli utenti adulti di designare qualcuno che riceva notifiche di supporto. OpenAI collabora con psicologi, psichiatri, esperti di libertà civili e forze dell'ordine per perfezionare il suo approccio.

Fatti principali

OpenAI ha pubblicato il post il 23 aprile 2026.
I modelli sono addestrati a rifiutare richieste che potrebbero abilitare violenza.
Le salvaguardie riconoscono segnali di allarme sottili in conversazioni lunghe.
Il rilevamento automatico utilizza classificatori, modelli di ragionamento, hash-matching e blocklist.
Revisori umani valutano gli account segnalati nel contesto.
Le violazioni comportano la revoca immediata dell'account.
Le forze dell'ordine vengono informate in caso di rischio credibile imminente di danno.
I controlli parentali sono stati introdotti nell'autunno 2025.

OpenAI dettaglia le misure di prevenzione della violenza per ChatGPT

Fatti principali

Entità

Istituzioni

Fonti