Gli LLM generano diagrammi UML da richieste degli sviluppatori
I ricercatori hanno svelato un nuovo metodo per generare diagrammi UML guidati da query, consentendo ai LLM di produrre diagrammi che rispondono direttamente a domande in linguaggio naturale riguardanti il codice. Questa tecnica prevede il fine-tuning di Qwen2.5-Coder-14B utilizzando un dataset accuratamente selezionato composto da file di codice, domande degli sviluppatori e le relative rappresentazioni diagrammatiche in formato JSON strutturato. Il processo di valutazione include sia il rilevamento automatico di difetti strutturali sia la valutazione umana della rilevanza semantica. I risultati indicano che il fine-tuning su un insieme limitato di dati corretti manualmente porta a miglioramenti significativi. Questo approccio affronta il problema della documentazione software, che spesso diventa obsoleta o è del tutto assente, offrendo approfondimenti mirati sui codebase senza dettagli eccessivi.
Fatti principali
- La generazione di diagrammi UML guidata da query utilizza LLM per rispondere alle domande degli sviluppatori.
- Fine-tuning di Qwen2.5-Coder-14B su un dataset curato di codice, query e diagrammi.
- La valutazione include il rilevamento automatico di difetti strutturali e la valutazione umana della rilevanza semantica.
- Dati modesti corretti manualmente producono miglioramenti drammatici.
- Affronta la documentazione software obsoleta o mancante.
- Produce diagrammi semanticamente focalizzati con solo elementi rilevanti.
- Pubblicato su arXiv con ID 2604.23816.
- L'approccio differisce dagli strumenti automatici di reverse engineering che producono dettagli eccessivi.
Entità
Istituzioni
- arXiv