La traduzione automatica preserva la semantica morale tra le lingue
Un nuovo studio di arXiv dimostra che la traduzione basata su LLM può preservare i segnali morali tra le lingue, utilizzando il polacco come lingua di test con circa 50.000 post sui social media annotati. La ricerca applica un pipeline di validazione a quattro metodi che include la similarità LaBSE, CKA, LLM-as-judge e test di parità del classificatore. I risultati mostrano che la traduzione diretta mantiene sottili semantiche morali nonostante le sfide con slang ed espressioni culturali.
Fatti principali
- Lo studio utilizza circa 50.000 post sui social media annotati moralmente
- Il polacco è la lingua di test per il trasferimento cross-linguistico
- È stato impiegato un pipeline di validazione a quattro metodi
- La traduzione diretta preserva i segnali morali per l'apprendimento automatico
- Le sfide includono slang, volgarità ed espressioni culturalmente cariche
- La similarità coseno media è stata utilizzata come metrica
- ID del paper arXiv: 2605.22660
- La traduzione basata su LLM colma il divario nei corpora morali
Entità
Istituzioni
- arXiv