DiffCodeGen: Scaling guidato dalla copertura per la generazione di codice al momento del test
Un nuovo metodo per migliorare la generazione di codice al momento dell'inferenza, DiffCodeGen, utilizza un'analisi differenziale guidata dalla copertura per selezionare la soluzione migliore senza fare affidamento su casi di test pubblici o su un'ampia inferenza LLM. Genera diversi candidati di codice tramite campionamento e prompting variati, sintetizza input attraverso fuzzing guidato dalla copertura, raggruppa i candidati per similarità comportamentale e restituisce il medoide del cluster più grande. Questo approccio riduce il consumo di token e il sovraccarico di tempo rispetto ai precedenti metodi di scaling al momento del test.
Fatti principali
- DiffCodeGen è un nuovo metodo di scaling al momento del test per la generazione di codice.
- Utilizza un'analisi differenziale guidata dalla copertura.
- Genera diversi candidati di codice utilizzando varie strategie di campionamento e prompting.
- Applica il fuzzing guidato dalla copertura per sintetizzare input senza test esistenti o LLM.
- I candidati vengono raggruppati in base alla similarità comportamentale derivante dall'esecuzione su input sintetizzati.
- Il medoide del cluster più grande viene selezionato come output finale.
- Il metodo non si basa su casi di test pubblici.
- Riduce il consumo di token e il sovraccarico di tempo rispetto ai metodi precedenti.
Entità
Istituzioni
- arXiv