Leggibilità del codice generato da LLM poco studiata
Un nuovo studio di arXiv indaga sistematicamente la leggibilità del codice generato da Large Language Models (LLM). La ricerca stabilisce un modello completo di leggibilità che sintetizza caratteristiche testuali, strutturali, di programma e visive. Valuta il codice di LLM mainstream in 5.869 scenari estratti da World of Code (WoC) e LeetCode. I risultati indicano che gli attuali LLM producono codice con una leggibilità complessiva diversa da quella del codice scritto da umani, e la progettazione del prompt influenza significativamente la leggibilità. Lo studio sottolinea la necessità di revisione umana nonostante i miglioramenti nella qualità funzionale.
Fatti principali
- Lo studio di arXiv (2605.13280) esamina la leggibilità del codice generato da LLM.
- Il modello di leggibilità include caratteristiche testuali, strutturali, di programma e visive.
- La valutazione utilizza 5.869 scenari da WoC e LeetCode.
- I LLM mainstream testati producono codice con pattern di leggibilità distinti.
- La progettazione del prompt influisce sui risultati di leggibilità.
- La revisione umana rimane necessaria per il codice generato da LLM.
- La qualità funzionale del codice LLM è ben studiata, ma la leggibilità è poco studiata.
- La ricerca mira a quantificare sistematicamente la leggibilità del codice.
Entità
Istituzioni
- arXiv
- World of Code (WoC)
- LeetCode