Traduzione basata su LLM delle Rappresentazioni Intermedie del Compilatore
Un nuovo articolo di ricerca presenta IRIS-14B, un modello transformer da 14 miliardi di parametri ottimizzato per tradurre tra GIMPLE di GCC e LLVM IR di LLVM, due distinte Rappresentazioni Intermedie utilizzate dai principali compilatori. Il lavoro affronta la sfida dell'interazione tra toolchain, che è stata limitata dalle differenze semantiche e strutturali tra queste IR. I traduttori tradizionali basati su regole si sono rivelati complessi e costosi da mantenere. Gli autori propongono un approccio basato sui dati utilizzando Large Language Models (LLM) per apprendere le mappature dagli esempi. L'articolo è disponibile su arXiv con identificatore 2605.08247.
Fatti principali
- IRIS-14B è un modello transformer da 14 miliardi di parametri.
- Traduce tra GIMPLE (GCC) e LLVM IR.
- L'articolo è su arXiv con ID 2605.08247.
- Gli LLM offrono un'alternativa basata sui dati ai traduttori basati su regole.
- GCC e LLVM sono alla base di gran parte dell'infrastruttura software moderna.
- L'interazione tra toolchain è ostacolata dalle differenze delle IR.
- I traduttori basati su regole hanno elevata complessità e costi di manutenzione.
- Il modello è ottimizzato per la traduzione di IR del compilatore.
Entità
Istituzioni
- arXiv