Il framework MA-CoT riduce le vulnerabilità di sicurezza del codice del 57,6%

ai-technology · 2026-05-26

Un gruppo di ricercatori ha presentato un approccio innovativo chiamato Mitigation-Aware Chain-of-Thought (MA-CoT), progettato per aumentare la sicurezza della generazione di codice con modelli linguistici di grandi dimensioni (LLM). Questo framework combina tecniche di mitigazione CWE specifiche con salvaguardie sensibili al linguaggio per ridurre le vulnerabilità persistenti. Durante gli esperimenti con tre LLM—gpt-5, claude-4.5 e gemini-2.5—in C, Java e Python, utilizzando quattro metodi di prompting su un dataset di 200 compiti e testando su LLMSecEval, MA-CoT è riuscito a ridurre i problemi di sicurezza da 92 a 39 (una diminuzione del 57,6%) e da 73 a 4 (una diminuzione del 94,5%) su LLMSecEval. Inoltre, i problemi gravi hanno registrato un calo significativo, affrontando le incongruenze nei risultati di sicurezza derivanti dagli attuali metodi di prompt engineering.

Fatti principali

Il framework MA-CoT incorpora linee guida di mitigazione CWE specifiche per il compito e salvaguardie sensibili al linguaggio.
Valutato su gpt-5, claude-4.5, gemini-2.5.
Testato su C, Java, Python.
Confrontate le strategie di prompting Vanilla, Zero-shot, CoT, MA-CoT.
Dataset primario di 200 compiti; validazione esterna su LLMSecEval.
Risultati di sicurezza totali ridotti da 92 a 39 (57,6%) sul dataset primario.
Risultati ridotti da 73 a 4 (94,5%) su LLMSecEval.
Risultati di alta gravità (Blocker + Critical) significativamente ridotti.

Entità

—

Fonti

arXiv cs.AI — 2026-05-26