
一、術(shù)語庫建設(shè)
1. 初始構(gòu)建
收集各領(lǐng)域的專業(yè)術(shù)語。例如從行業(yè)標(biāo)準(zhǔn)文檔、專業(yè)教材、權(quán)威學(xué)術(shù)論文等來源獲取術(shù)語。對于醫(yī)學(xué)領(lǐng)域,像“心肌梗死(myocardial infarction)”這樣的術(shù)語,要確保準(zhǔn)確收錄其對應(yīng)的中英文表達(dá)。
組織專業(yè)的語言學(xué)家和相關(guān)領(lǐng)域?qū)<覅⑴c術(shù)語庫的創(chuàng)建。比如在法律翻譯方面,讓法律專業(yè)人士和翻譯專家共同確定像“管轄權(quán)(jurisdiction)”等術(shù)語的準(zhǔn)確翻譯。
2. 持續(xù)更新
隨著行業(yè)發(fā)展,不斷添加新出現(xiàn)的術(shù)語。如在科技領(lǐng)域,“量子計算(quantum computing)”這個術(shù)語出現(xiàn)后,要及時更新到術(shù)語庫。
對已有的術(shù)語進(jìn)行修正,如果發(fā)現(xiàn)某些術(shù)語的翻譯在特定語境下不準(zhǔn)確,要及時調(diào)整。
二、人工智能算法優(yōu)化
1. 預(yù)訓(xùn)練
在大規(guī)模語料上進(jìn)行預(yù)訓(xùn)練時,對包含專業(yè)術(shù)語的語料給予特殊關(guān)注。例如在預(yù)訓(xùn)練自然語言處理模型時,將包含大量金融術(shù)語的財經(jīng)新聞?wù)Z料進(jìn)行特殊標(biāo)記和加權(quán),使模型更好地學(xué)習(xí)專業(yè)術(shù)語的語義。
采用多語言預(yù)訓(xùn)練,以便在不同語言的術(shù)語之間建立更準(zhǔn)確的映射關(guān)系。比如在漢英翻譯中,通過同時預(yù)訓(xùn)練中文和英文的語料,更好地理解像“針灸(acupuncture)”這樣具有文化特色的術(shù)語在兩種語言中的表達(dá)。
2. 微調(diào)
針對特定領(lǐng)域的專業(yè)術(shù)語,對預(yù)訓(xùn)練模型進(jìn)行微調(diào)。如果是翻譯航空航天領(lǐng)域的內(nèi)容,就用航空航天相關(guān)的語料對模型進(jìn)行微調(diào),提高對諸如“航空發(fā)動機(jī)(aero
engine)”等術(shù)語的翻譯準(zhǔn)確性。
三、人工校對與審核
1. 專業(yè)人員審核
雇傭相關(guān)領(lǐng)域的專家對翻譯結(jié)果進(jìn)行審核。在翻譯化學(xué)領(lǐng)域的文獻(xiàn)時,讓化學(xué)專家檢查像“化學(xué)元素周期表(periodic table of chemical elements)”等術(shù)語的翻譯是否準(zhǔn)確。
建立多輪審核機(jī)制,確保復(fù)雜術(shù)語和概念的翻譯經(jīng)過多個人的檢查,減少錯誤。
2. 反饋機(jī)制
從客戶或用戶那里收集關(guān)于術(shù)語翻譯準(zhǔn)確性的反饋。如果客戶在工程翻譯中發(fā)現(xiàn)“土木工程(civil engineering)”的翻譯存在問題,及時根據(jù)反饋進(jìn)行調(diào)整。