MultiVul: Quadro Contrastivo Multimodale per il Rilevamento di Vulnerabilità Software
È stato introdotto un nuovo quadro denominato MultiVul per migliorare il rilevamento delle vulnerabilità software allineando le rappresentazioni del codice e dei commenti. Gli approcci tradizionali spesso si basano su rappresentazioni del codice a singola modalità, trascurando preziosi spunti semantici presenti nei commenti. MultiVul incorpora l'apprendimento di similarità duale e la regolarizzazione della consistenza, integrati da una varietà di coppie codice-testo. I test sui dataset DiverseVul e Devign utilizzando quattro LLM (DeepSeek-Coder-6.7B, Qwen2.5-Coder-7B, StarCoder2-7B, CodeLlama-7B) dimostrano un miglioramento dell'F1 fino al 27,07% rispetto ai metodi basati su prompting.
Fatti principali
- MultiVul è un quadro contrastivo multimodale per il rilevamento di vulnerabilità.
- Allinea le rappresentazioni del codice e dei commenti.
- Utilizza l'apprendimento di similarità duale e la regolarizzazione della consistenza.
- Arricchito con diverse coppie codice-testo.
- Testato sui dataset DiverseVul e Devign.
- Valutato su quattro LLM: DeepSeek-Coder-6.7B, Qwen2.5-Coder-7B, StarCoder2-7B, CodeLlama-7B.
- Raggiunge un miglioramento dell'F1 fino al 27,07% rispetto ai metodi basati su prompting.
- Affronta la limitazione delle rappresentazioni del codice a singola modalità.
Entità
—