Metodi di traduzione automatica a confronto per documenti sull'arte rupestre
Uno studio recente su arXiv valuta tre diversi sistemi di traduzione automatica inglese applicati a un testo accademico spagnolo sull'arte rupestre, con enfasi sulla precisione terminologica. I sistemi analizzati includono DeepL (un robusto baseline NMT), Gemini-Simple (un LLM che utilizza prompt di base) e Gemini-RAG (un LLM che migliora il prompting con recupero di coppie terminologiche basato su glossario). Attraverso valutazioni umane che utilizzano la valutazione diretta multi-way e controlli terminologici mirati con una tassonomia MQM limitata, Gemini-RAG ha raggiunto la massima accuratezza terminologica esatta, pari all'81,4%. Questa ricerca sottolinea l'importanza di una terminologia specialistica precisa nella condivisione del patrimonio culturale per prevenire interpretazioni errate da parte di non esperti.
Fatti principali
- Lo studio confronta tre configurazioni di traduzione automatica per la traduzione in inglese di un testo spagnolo sull'arte rupestre
- Configurazioni: DeepL (baseline NMT), Gemini-Simple (LLM con prompt di base), Gemini-RAG (LLM con glossario)
- Metodi di valutazione: valutazione diretta multi-way e auditing terminologico con tassonomia MQM
- Gemini-RAG ha raggiunto l'81,4% di accuratezza terminologica esatta
- Focus su interventi semplici e operativamente fattibili piuttosto che su modifiche complesse a livello di modello
- Le istituzioni del patrimonio culturale affrontano vincoli nella divulgazione multilingue a causa di budget e personale limitati
- Piccoli errori lessicali in domini ricchi di terminologia possono fuorviare i non specialisti e ridurre il riutilizzo
- Pubblicato su arXiv con ID 2605.14679
Entità
Istituzioni
- arXiv