Valutazione della sicurezza del codice generato da LLM attraverso metodi di prompting
Uno studio su arXiv (2605.24298) valuta la sicurezza del codice generato da cinque LLM in Java, C++, C e Python utilizzando vari metodi di prompt engineering. Gli autori introducono una strategia di chain-of-thought zero-shot consapevole delle debolezze (WA-0CoT) che incorpora le mappature CWE per il contesto di sicurezza. I test chi-quadrato non mostrano una riduzione statisticamente significativa della frequenza o densità delle vulnerabilità tra i metodi, incluso WA-0CoT.
Fatti principali
- L'articolo arXiv 2605.24298 valuta la sicurezza del codice generato da LLM
- Cinque LLM testati in Java, C++, C e Python
- La strategia di prompting WA-0CoT utilizza le mappature CWE
- I test chi-quadrato non hanno trovato una riduzione significativa delle vulnerabilità
- I metodi di prompting includono WA-0CoT e altri
Entità
Istituzioni
- arXiv