ARTFEED — Contemporary Art Intelligence

Valutazione della sicurezza del codice generato da LLM attraverso metodi di prompting

other · 2026-05-26

Uno studio su arXiv (2605.24298) valuta la sicurezza del codice generato da cinque LLM in Java, C++, C e Python utilizzando vari metodi di prompt engineering. Gli autori introducono una strategia di chain-of-thought zero-shot consapevole delle debolezze (WA-0CoT) che incorpora le mappature CWE per il contesto di sicurezza. I test chi-quadrato non mostrano una riduzione statisticamente significativa della frequenza o densità delle vulnerabilità tra i metodi, incluso WA-0CoT.

Fatti principali

  • L'articolo arXiv 2605.24298 valuta la sicurezza del codice generato da LLM
  • Cinque LLM testati in Java, C++, C e Python
  • La strategia di prompting WA-0CoT utilizza le mappature CWE
  • I test chi-quadrato non hanno trovato una riduzione significativa delle vulnerabilità
  • I metodi di prompting includono WA-0CoT e altri

Entità

Istituzioni

  • arXiv

Fonti