Il Metodo BootTrans Utilizza Suite di Test per la Traduzione Multilingue del Codice
BootTrans, una nuova tecnica di bootstrapping, affronta due ostacoli significativi nella traduzione del codice tra vari linguaggi di programmazione: la limitata disponibilità di dati paralleli con oracoli di test funzionali e l'ottimizzazione disomogenea tra le coppie di linguaggi. Questo metodo sfrutta l'invarianza funzionale e l'adattabilità cross-linguale delle suite di test, trasformando abbondanti test unitari in linguaggio pivot in oracoli di verifica universali per l'addestramento nell'apprendimento per rinforzo multilingue. BootTrans presenta un sistema a doppio pool composto da pool di seed e di esplorazione per migliorare gradualmente i dati di addestramento tramite la raccolta di esperienze guidata dall'esecuzione. Impiega inoltre un sistema di ponderazione consapevole del linguaggio che regola le priorità per le direzioni di traduzione più difficili in base alle prestazioni tra linguaggi correlati, affrontando così le disparità di ottimizzazione. Descritto dettagliatamente nel documento di ricerca con identificatore arXiv 2601.03512v2, esperimenti estesi convalidano la sua capacità di gestire efficacemente diverse coppie di linguaggi superando sia le limitazioni dei dati che i problemi di ottimizzazione attraverso applicazioni innovative delle suite di test e un'esplorazione ponderata.
Fatti principali
- BootTrans è un metodo di bootstrapping per la traduzione del codice tra più linguaggi di programmazione
- Affronta la scarsità di dati paralleli con oracoli di test eseguibili
- Risolve lo squilibrio di ottimizzazione nella gestione di diverse coppie di linguaggi
- Il metodo sfrutta l'invarianza funzionale e la portabilità cross-linguale delle suite di test
- Adatta test unitari in linguaggio pivot come oracoli di verifica universali per l'addestramento RL multilingue
- Utilizza un'architettura a doppio pool con pool di seed e di esplorazione per l'espansione progressiva dei dati
- Include un meccanismo di ponderazione consapevole del linguaggio per dare priorità alle direzioni di traduzione più difficili
- Documento di ricerca disponibile come arXiv:2601.03512v2 con Announce Type: replace-cross
Entità
Istituzioni
- arXiv