Benchmark di Sicurezza dei Modelli AI per i Rischi di Armi Biologiche

ai-technology · 2026-04-24

Uno studio recente pubblicato su arXiv valuta quattro modelli AI di spicco—ChatGPT 5.2 Auto, Gemini 3 Pro Thinking, Claude Opus 4.5 e Meta's Muse Spark Thinking—utilizzando 73 prompt STEM benigni aperti e orientati ai principianti per esaminare la loro intelligenza operativa e il rischio di uso improprio biologico. Questa ricerca è stata motivata dalle preoccupazioni espresse da esperti di AI e dai rapporti sulla sicurezza che evidenziano come i progressi nel ragionamento dei modelli potrebbero consentire a utenti con bassa competenza di abusare della tecnologia. I risultati hanno indicato che Gemini e Meta eccellevano in compiti quantitativi benigni, mentre ChatGPT era in qualche modo efficace ma mancava di profondità, e Claude mostrava il minor numero di risposte, inclusi alcuni falsi positivi di rifiuto. Un test di follow-up volto a identificare intenti dannosi sottili ha mostrato che Gemini faticava con la consapevolezza contestuale in casi limite. Di conseguenza, è stata ritenuta necessaria un'analisi dettagliata del potenziale di Gemini per la militarizzazione, poiché le sue capacità sembravano superare gli sforzi di moderazione. Lo studio ha rivelato che le salvaguardie sviluppate dai principali laboratori sono ancora in fase di sviluppo.

Fatti principali

Modelli sottoposti a benchmark: ChatGPT 5.2 Auto, Gemini 3 Pro Thinking, Claude Opus 4.5, Meta's Muse Spark Thinking
73 prompt STEM benigni aperti e formulati per principianti utilizzati
Gemini e Meta hanno ottenuto punteggi molto alti in compiti quantitativi benigni
ChatGPT parzialmente utile ma con testo ridotto
Claude il più scarso con falsi positivi di rifiuto
Secondo set di test ha rilevato intenti dannosi sottili
Gemini ha mostrato mancanza di consapevolezza contestuale in prompt di casi limite
Analisi focalizzata sulla militarizzazione di Gemini in quattro ambienti di accesso

Benchmark di Sicurezza dei Modelli AI per i Rischi di Armi Biologiche

Fatti principali

Entità

Istituzioni

Fonti