OpenAI descrive le minacce di ingegneria sociale per gli agenti AI e le contromisure difensive

digital · 2026-04-14

Thomas Shadwell e Adrian Spânu, ricercatori di sicurezza presso OpenAI, hanno delineato l'evoluzione degli attacchi di prompt injection sugli agenti AI, che ora presentano somiglianze con le tattiche di ingegneria sociale. Questi attacchi sfruttano i sistemi di AI inserendo comandi fuorvianti in contenuti esterni, portando a comportamenti non autorizzati. Un caso notevole nel 2025, che coinvolgeva ChatGPT, ha rivelato un tasso di successo del 50% quando i ricercatori hanno istruito il sistema a esaminare email relative alle procedure dei dipendenti. L'approccio di OpenAI alla difesa combina misure di sicurezza convenzionali con la gestione del rischio di ingegneria sociale, trattando gli agenti AI in modo simile a rappresentanti umani. Le loro strategie includono Safe Url per rilevare la condivisione di informazioni sensibili. I ricercatori sottolineano che le difese efficaci devono essere progettate per minimizzare gli effetti della manipolazione, citando lo studio del 2023 di J. Rehberger sulle minacce di injection AI. OpenAI sta anche indagando le implicazioni dell'architettura di sicurezza per l'ingegneria sociale e l'addestramento dell'AI.

Fatti principali

Gli attacchi di prompt injection manipolano gli agenti AI attraverso contenuti esterni ingannevoli
Gli attacchi sofisticati ora impiegano tattiche di ingegneria sociale piuttosto che semplici sovrascritture
Un esempio di attacco ChatGPT del 2025 ha avuto un tasso di successo del 50% nei test
I ricercatori di OpenAI Thomas Shadwell e Adrian Spânu hanno redatto l'analisi
Le difese includono la mitigazione Safe Url che richiede la conferma dell'utente per trasmissioni sensibili
L'approccio tratta gli agenti AI in modo simile ai rappresentanti del servizio clienti umani in ambienti avversi
Le mitigazioni si estendono alle funzionalità di ChatGPT come Atlas, Deep Research, Canvas e Apps
OpenAI continua a ricercare le implicazioni dell'ingegneria sociale per la sicurezza dell'AI

Entità

Artisti

Thomas Shadwell
Adrian Spânu
J. Rehberger

Istituzioni

OpenAI

Fonti

OpenAI Blog — 2026-03-11