機器輔助翻譯之TRADOS知多少

2021-01-10 重慶西訊翻譯

戳上面的藍字關注我們哦!

劉洪燕

西訊翻譯項目部 中級翻譯/主管

西訊語言培訓中心教學部 中級培訓導師

隨著網絡資訊時代的不斷發展,如何有效消除人與人之間的語言障礙,成為全人類面臨的共同問題。翻譯是克服語言障礙的有力手段,專業的翻譯公司是跨文化交流的橋梁,translator更是文化傳播的使者。然而,傳統的純人工翻譯方式因成本高、耗時長等原因似乎已經不能滿足翻譯市場某些客戶稿件數量大、時間緊的需求。於是,機器輔助翻譯應運而生。

那麼,什麼是機器輔助翻譯呢?

在說機器輔助翻譯之前,我先說下我對機器翻譯的理解。機器翻譯(Machine Translation,簡稱MT)是利用計算機把一種語言轉變成另一種語言的過程,是由機器自動完成的。機器翻譯雖然簡單方便,但在翻譯準確性方面還有待提高。機器翻譯軟體是讓機器代替人進行翻譯,主要是針對外語基礎比較差的用戶,目的是幫助他們解決基本的語言障礙問題。

機器輔助翻譯(Machine Aided Translation,簡稱「MAT」),通常我們又稱為計算機輔助翻譯(Computer-aidedTranslation,簡稱CAT)。計算機輔助翻譯是在語言資料庫和我們translator的共同參與下完成整個翻譯過程,翻譯質量和人工翻譯相同甚至更好,而且能大大提高翻譯效率。它主要針對的是外語水平比較高的用戶(一般是指專業翻譯公司或翻譯個體),強調的是輔助翻譯的作用,而不是替代人的翻譯工作;人在翻譯過程中起主導作用,人的翻譯水平決定了譯文的質量。

機器翻譯和機器輔助翻譯是兩個既有聯繫又有本質區別的概念,不能混淆。在機器翻譯時,我們可以在機譯程序中打開需要翻譯的文件,翻譯程序會自動地全部或部分地把源語言轉化為目標語言。而機器輔助翻譯只是協助我們進行翻譯,軟體本身並不能把源語言轉化為目標語言。機器輔助翻譯軟體在使用之初只是一張白紙,需要不斷地進行學習、記憶,才能達到提高翻譯效率和翻譯質量的目的。

那麼機器輔助翻譯軟體在實際翻譯工作中是如何為我們服務的呢?在這裡我主要以TRADOS為例為大家進行說明。

TRADOS的核心是翻譯記憶(Translation Memory,即MT)技術,它繞開了語言學的瓶頸,在後臺不斷學習和自動儲存新的譯文,將翻譯過的所有資料以句子為單位存入我們建立的記憶庫。翻譯時系統自動對源語言進行分析,與資料庫中100%匹配的句子可自動替換,未替換匹配的句子可以根據匹配度提出翻譯建議。相同或相近的詞語或短語出現時,系統會自動搜索翻譯記憶庫中相同或相似的翻譯資源(句子、段落等),給出參考譯文。對於系統給出的參考譯文,建議修改後再使用,如果覺得句型不滿意,也可以棄之不用。對於全新的句子,我們可以根據系統提供的翻譯建議進行翻譯,而每一次的翻譯又作為積累的新資源,加入我們自己建立的記憶庫。在翻譯全新的大型項目時,翻譯速度會慢一點;但是根據我平時的經驗,大型項目的資料內容一般都有一定的重複性或類似性,所以當記憶庫積累了一定數量的專業詞彙和句型後,翻譯速度就會加快。相同的內容不用翻譯第二次。比如,我們翻譯產品的說明書,只需翻譯一個版本,在產品更新換代或出現相關產品時,部分相同或相似內容便可以直接調用。若認為記憶庫的翻譯不夠準確,可以修訂後再使用,這樣既能保證譯件的一致性,又能保證翻譯質量。

TRADOS翻譯記憶庫的記憶功能可以實現將確認後的譯文和原文導入資料庫,匹配功能可以實現翻譯過程中的自動檢索匹配。記憶功能和匹配功能相輔相成、相互依託,兩者緊密結合才能發揮各自的優勢。

記憶功能是指在翻譯過程中TRADOS自動存儲譯文,整理、建立並不斷更新記憶庫,而匹配功能則是指對比分析記憶庫裡面的源語言資料和新項目源語言文件,精確找出匹配的句子和段落,在下文出現相同或相似句段時可自動彈出記憶庫所存儲的對應譯文。句段匹配度可自行設置。比如,將匹配度設置為60%就意味著當匹配度達到60%及以上時,譯文句段會自動填充至目標語言列。我們可以直接採用或局部修改、調整譯文,將更多精力放在新內容的翻譯上。藉助記憶和匹配功能,我們可以根據現有譯文更好地理解原文,產出合格譯文,保持同一類文本的前後一致性;當出現重複句段時,也不用重複操作,這樣可以節約大量時間和精力,從而提高翻譯的產出效率、整體質量和一致性。

值得一提的是TRADOS還支持網絡共享記憶庫功能。當多人同時合作同一翻譯項目時,可以通過區域網共享一個翻譯記憶庫,每個在線的translator都可以實時調用團隊其他人員的翻譯結果。這無疑是提高團隊生產效率的法寶之一,省去了大量統一譯文風格的工作,也能最大程度避免表述不一的問題。

記憶庫好比一位老師,在我們工作的時候不時地指出哪些句子應該如何翻譯,當然這都是建立在事先建好記憶庫的基礎上的。使用TRADOS之後,我便將我所翻譯的稿件按照不同種類建立了記憶庫,將所有的同類型稿件都存儲在了相應記憶庫中,每次翻譯時都會調用相應的記憶庫,不斷將新資料更新到記憶庫中去。同樣,公司經過多年經營,已經有了部分穩定的客戶群,產品類型也相對穩定,我們也會按照不同種類的產品,建立記憶庫,在翻譯類似產品文件時調用記憶庫,這樣既能保證效率又能保證質量。

另外,使用TRADOS分析文件時能統計重複字數(不需要翻譯字數)和不匹配字數(翻譯任務)。根據匹配率的不同,TRADOS會計算出各個匹配區間的字數和字符數,而且每一項翻譯任務都顯示翻譯進度和文件路徑,便於項目管理。

使用TRADOS翻譯時,需要在編輯器界面進行。TRADOS默認每個句子為一個翻譯單元,並自動將文件按照翻譯單元切分。每翻譯完一個句子,Ctrl+Enter確認翻譯完畢,編輯器界面出現鉛筆打勾圖標,表示100%翻譯完畢,若有比分疏漏(表示譯文存在疏漏,如標記等),則不顯示該圖標,這就使翻譯工作進度一目了然。在使用TRADOS打開word文件進行翻譯時,可以預覽正在翻譯的文件,在編輯器最右側以word界面同步顯示翻譯進度,這大大增強了可視性,並且在word界面顯示的譯文與原文格式完全相同。

以上主要從記憶功能、匹配功能、文件分析及編輯可視性幾點說明了我對TRADOS在翻譯實踐中的運用認識。鑑於傳統翻譯模式與機器輔助翻譯軟體的結合已是翻譯行業發展的趨勢,所以,不論是專業的翻譯公司還是想要長期立足於翻譯行業的翻譯個體,都建議緊跟行業發展的潮流,掌握一種或多種計算機輔助翻譯軟體,由此我們的翻譯工作才會更加如魚得水,如虎添翼,大大提高翻譯效率、翻譯質量,最終滿足客戶翻譯稿件數量大、時間緊的需求。

*** END ***

圖/網絡

本文曾刊載於《訊號》總第13期 ——《譯中人》

相關焦點

  • 翻譯行業的發展方向:機器翻譯VS人工翻譯
    近年來,機器翻譯技術有了很多新的突破,在實際的語言服務實踐中,機器翻譯有了很多成功的案例。機器翻譯必將深刻影響翻譯服務行業,將給人工翻譯帶來實際的威脅。另一方面,機器翻譯以其人工翻譯難以比擬的速度,將提高人類對於海量信息的處理能力,彌補人工翻譯在速度和成本方面的不足。不管你喜不喜歡,你都無法迴避機器翻譯的發展。如何利用機器翻譯技術成了翻譯服務行業的重要課題。
  • 機器翻譯能解放生產力嗎?
    機器翻譯能否代替人工翻譯」這類的話題呢?在翻譯領域裡,基於自然語言「神經網絡模型」的機器翻譯的出現,終於讓大家看到了顛覆性的技術。從中,大家看到「神經網絡」的革命性和未來性,內心中對這項技術有了些憧憬和疑問,也就有了如此疑問。我們不講總的機器翻譯歷史和時間軸事件,僅從應用角度到來看,軟體翻譯可以有三個階段。
  • SDL發布翻譯軟體Trados Studio 2009 SP3
    新浪科技訊 北京時間10月18日中午消息,全球信息管理解決方案提供商SDL今日宣布發布計算機輔助翻譯軟體SDL Trados Studio 2009 SP3。使SDL Trados進入多語翻譯記憶庫時代。
  • 搜狗機器翻譯團隊獲得 WMT 2017 中英機器翻譯冠軍
    本文由機器之心編輯,「機器之心」專注生產人工智慧專業性內容,適合開發者和從業者閱讀參考。點擊右上角即刻關注。每年的第三季度都是機器學習相關的頂級學術會議密集召開的時期,今年也不例外。近年來,幾乎所有的研究機構在發表關於機器翻譯新方法的論文時,都會以 WMT 數據集作為實驗數據,並以 BLEU 評分來衡量方法的有效性,給出一個量化的、可比的翻譯質量評估,因此,WMT 數據集已經成為機器翻譯領域公認的主流數據集。
  • 翻譯輔助軟體Transmate如何調用有道翻譯API接口實現快速翻譯
    Transmate簡介:Transmate單機版是在單機上使用的翻譯輔助軟體(CAT),目前供用戶免費下載和使用。它集原文預覽、偽翻譯、預翻譯、排版、翻譯記憶、拼寫檢查、低錯檢查、在線翻譯等功能於一體,避免重複翻譯、減少翻譯工作量、提高翻譯效率、確保譯文的統一性。
  • 機器翻譯三大核心技術原理 | AI知識科普
    03機器翻譯的技術原理在講機器翻譯的技術原理之前,我們先來看一張機器翻譯技術發展歷史圖:20世紀80年代基於規則的機器翻譯開始走向應用,這是第一代機器翻譯技術。隨著機器翻譯的應用領域越來越複雜,基於規則的機器翻譯的局限性開始顯現,應用場景越多,需要的規則也越來越多,規則之間的衝突也逐漸出現。
  • 王維、楊絳與機器翻譯的本質
    他的《哥德爾、艾舍爾、巴赫:集異璧之大成》啟發了幾代人對人工智慧的思考。 翻譯:時空穿梭的旅行 侯世達教授在演講之初就問: 翻譯究竟是什麼,它可以實現什麼目的?
  • 機器之心獨家對話百度 NLP:先解決語義理解,再談機器翻譯取代人類
    機器之心原創作者:虞喵喵9 月 28 日,Google 在 Research Blog 中介紹其神經網絡機器翻譯系統(GNMT)進展,譯文質量的大幅提升引發業內極大關注。據稱,在雙語評估者的幫助下,通過對維基百科和新聞網站的例句測定,在多個樣本的翻譯中谷歌神經網絡機器翻譯系統將錯誤降低了 55-85%甚至更多。
  • 未來的世界:機器翻譯VS人工翻譯
    這個語料加工的技術層面工作,可以讓專業人員(懂英漢兩種語言的法律專業人員)和語言服務專家完成,包括對機器翻譯的譯文進行與原文的比較和校對,然後修改後輸回機器,再讓其進行再學習翻譯,再修改和完善語料庫文本。這樣,隨著機器翻譯實踐的不斷增加,這款專業翻譯機器的準確率達到90%甚至以上不是不可以做到的。翻譯內容越專業,場景或任務越固定,標準越統一,翻譯準確率就越高,替代人工翻譯不是不可能。
  • B站「不靠譜」翻譯大賽:機器翻譯,還遠不能取代人工翻譯
    一書中,著名翻譯家、普林斯頓大學比較文學系博士大衛·貝洛斯探討了關於翻譯語境、機器翻譯的起源以及文學翻譯等話題,來幫助我們更好地理解翻譯這項工作。 1 翻譯難題之無對應語境 在探索和理解語言因何不同或因何相同方面,也有一段非凡的現代歷史。
  • Boolean運算知多少
    Boolean運算知多少?十進位的加減乘除四則運算在日常生活是自然而然的,但是又有多少人知道Boolean運算呢?
  • 劉慶峰的人工智慧機器模仿川普講話_機器漢英翻譯已達6級
    依靠人力做數據標註和依靠感知來獲取是截然不同的兩種途徑,也是人工智慧區別於人工「輔助」智能的根本,雲知聲將通過布局物聯網來自動獲取(語音)數據。他的話音剛落,機器瞬間給出流暢的英文翻譯。隨後他又用英文發問,機器回答「我很榮幸有機會展示我們的新技術。」 「科大訊飛的夢想,就是讓機器像人一樣,能說話、會思考。」劉慶峰說,如今,科大訊飛的語音合成技術已經讓機器能開口說話,「我們用機器模仿川普講話,連美國人都信以為真」。人工智慧也越來越有溫度,並超過了人類最好的速記員。在英文識別比賽中,科大訊飛也獲得了所有指標的第一名。
  • 《Nature》子刊:不僅是語言,機器翻譯還能把腦波「翻譯」成文字
    機器之心編譯參與:NeuR、張倩如果將人腦的神經信號也視為一種語言,那麼將機器翻譯架構應用於解讀神經信號的可行性似乎並不令人驚訝。在這項研究中,研究者試圖一次解碼一個句子,就像當下大多數機器翻譯算法一樣,因此這兩種任務實際上都映射到相同類型的輸出,即一個單詞序列對應於一個句子。另一方面,這兩種任務的輸入是存在很大區別的:分別是神經信號和文本。
  • 谷歌發布神經機器翻譯,翻譯質量接近筆譯人員
    據外媒報導,谷歌於昨日發布了網頁版本和移動版本的谷歌翻譯。在漢譯英的過程中,谷歌翻譯會採用全新的神經機器翻譯機制,而這個App每天要進行一千八百萬次這樣的翻譯。此外,谷歌針對這個神經機器翻譯系統的運作原理,專門發表了一篇學術論文。
  • 人工智慧翻譯 OR 人工翻譯?
    隨著2018博鰲亞洲論壇,「騰訊同傳」事件引發的熱烈的討論,人工智慧翻譯(或機器翻譯)與人工翻譯未來發展的討論再一次出現在人們面前。其實早在上世紀30年代,就有了機器翻譯語言的想法和實踐。
  • 英語四級翻譯:「風吹知多少」用英語怎麼說?
    英語四級翻譯:「風吹知多少」用英語怎麼說?  漢語中,用風和日麗,涼風習習來形容"風";英語中,因強度、破壞力等方面的差異,"風"也有多種表達,且每種表達的意思都略有不同。現列舉如下:  1.wind 風(泛指,普通用語)。
  • 哲學的時代擔當|從陸谷孫的翻譯智慧看機器翻譯的未來
    復旦大學外文學院資深翻譯專家陸谷孫先生,最近不幸因病醫治無效而辭世。我不是學習英語專業的,但因為關心與機器翻譯相關的人工智慧的哲學問題,故而平素也就多留意陸先生關於翻譯問題所發表的一些真知灼見。在此篇小文中,筆者借悼念先生的機會,從「如何對人類的翻譯機制進行機器模擬」的角度,重新發掘一下陸先生翻譯思想中的一些洞見。
  • 劉和平、韓林濤:下「機器翻譯替代人類」結論為時尚早
    這是全球首次在真實交際環境下測試機器同聲傳譯!150多名與會者見證了這一事件。一個星期後,我們拿到了為本次大會提供技術支持的Mark Seligman博士撰寫的的微軟機器翻譯應用報告初稿,鑑於技術保密等原因,我們這裡只從人工翻譯和機器翻譯對比的角度對此次人機比拼作出以下觀察思考。2018年3月15日camel AI科技評論消息稱,「機器翻譯新突破,微軟中英新聞翻譯達人類水平」。
  • 古文字被AI破譯,MIT和谷歌開發失傳語言的機器翻譯系統
    通過機器學習繪製特定語言的聯結 不難想像,近年來機器翻譯的最新進展對此有所幫助。 短短幾年內,注釋資料庫和讓機器從中學習的技術讓語言學習發生了革命性變化,這使得機器翻譯變得越來越普遍。儘管翻譯質量有待提高,但這也提供了思考語言的一個全新角度。