
一、準(zhǔn)確性評估
1. 詞匯準(zhǔn)確性
檢查源語言中的單詞和短語是否被準(zhǔn)確地翻譯成目標(biāo)語言中對應(yīng)的詞匯。例如,專業(yè)術(shù)語是否被正確翻譯。像“人工智能”在英文中是“Artificial Intelligence”,如果翻譯為其他不相關(guān)的詞匯,那就是不準(zhǔn)確的。
2. 語法正確性
確保翻譯后的句子符合目標(biāo)語言的語法規(guī)則。比如在英語中,主謂賓的結(jié)構(gòu)要正確,時態(tài)的使用要恰當(dāng)。如果源句是“I have eaten an apple”(我已經(jīng)吃了一個蘋果),翻譯成“He eat an apple”就是語法錯誤的。
二、語義完整性評估
1. 邏輯連貫性
整體譯文要在邏輯上連貫。例如,一個段落中的句子之間應(yīng)該有合理的邏輯關(guān)系。如果原文是因果關(guān)系的論述,譯文也應(yīng)該體現(xiàn)這種因果關(guān)系,不能把原因和結(jié)果的表述顛倒或者缺失邏輯聯(lián)系。
2. 語義保留度
譯文要完整地傳達(dá)源語言的語義內(nèi)容。不能遺漏重要信息或者改變原文的意思。比如原文是介紹某個產(chǎn)品的功能,譯文不能只翻譯部分功能或者歪曲產(chǎn)品功能的描述。
三、風(fēng)格適配評估
1. 文體風(fēng)格
根據(jù)翻譯的內(nèi)容類型(如文學(xué)作品、商務(wù)文件、技術(shù)文檔等),譯文要適配相應(yīng)的文體風(fēng)格。例如,文學(xué)作品的翻譯可能需要更富有文采,而商務(wù)文件的翻譯則更注重簡潔、正式。
2. 語言習(xí)慣
遵循目標(biāo)語言的語言習(xí)慣。像在中文里,我們常說“在……方面”,而英文中對應(yīng)的表達(dá)可能是“in terms of...”等,要根據(jù)目標(biāo)語言的習(xí)慣進(jìn)行自然的表達(dá)。
四、多維度量化評估(部分公司采用)
1. BLEU值(雙語評估替換)
這是一種常用的自動評估指標(biāo)。它通過比較機(jī)器翻譯的結(jié)果和人工翻譯的參考譯文,計算出一個得分。得分越高,說明翻譯結(jié)果與參考譯文越相似,在一定程度上反映了翻譯的質(zhì)量。
2. ROUGE值(面向召回的概括評價)
主要用于評估自動文摘和機(jī)器翻譯等任務(wù)中的質(zhì)量。它通過計算機(jī)器翻譯與參考譯文之間的重疊部分等方式來給出一個質(zhì)量評估值。