機器輔助翻譯之TRADOS知多少

2020-12-24 重慶西訊翻譯

戳上面的藍字關注我們哦!

劉洪燕

西訊翻譯項目部 中級翻譯/主管

西訊語言培訓中心教學部 中級培訓導師

隨著網絡資訊時代的不斷發展,如何有效消除人與人之間的語言障礙,成為全人類面臨的共同問題。翻譯是克服語言障礙的有力手段,專業的翻譯公司是跨文化交流的橋梁,translator更是文化傳播的使者。然而,傳統的純人工翻譯方式因成本高、耗時長等原因似乎已經不能滿足翻譯市場某些客戶稿件數量大、時間緊的需求。於是,機器輔助翻譯應運而生。

那麼,什麼是機器輔助翻譯呢?

在說機器輔助翻譯之前,我先說下我對機器翻譯的理解。機器翻譯(Machine Translation,簡稱MT)是利用計算機把一種語言轉變成另一種語言的過程,是由機器自動完成的。機器翻譯雖然簡單方便,但在翻譯準確性方面還有待提高。機器翻譯軟體是讓機器代替人進行翻譯,主要是針對外語基礎比較差的用戶,目的是幫助他們解決基本的語言障礙問題。

機器輔助翻譯(Machine Aided Translation,簡稱「MAT」),通常我們又稱為計算機輔助翻譯(Computer-aidedTranslation,簡稱CAT)。計算機輔助翻譯是在語言資料庫和我們translator的共同參與下完成整個翻譯過程,翻譯質量和人工翻譯相同甚至更好,而且能大大提高翻譯效率。它主要針對的是外語水平比較高的用戶(一般是指專業翻譯公司或翻譯個體),強調的是輔助翻譯的作用,而不是替代人的翻譯工作;人在翻譯過程中起主導作用,人的翻譯水平決定了譯文的質量。

機器翻譯和機器輔助翻譯是兩個既有聯繫又有本質區別的概念,不能混淆。在機器翻譯時,我們可以在機譯程序中打開需要翻譯的文件,翻譯程序會自動地全部或部分地把源語言轉化為目標語言。而機器輔助翻譯只是協助我們進行翻譯,軟體本身並不能把源語言轉化為目標語言。機器輔助翻譯軟體在使用之初只是一張白紙,需要不斷地進行學習、記憶,才能達到提高翻譯效率和翻譯質量的目的。

那麼機器輔助翻譯軟體在實際翻譯工作中是如何為我們服務的呢?在這裡我主要以TRADOS為例為大家進行說明。

TRADOS的核心是翻譯記憶(Translation Memory,即MT)技術,它繞開了語言學的瓶頸,在後臺不斷學習和自動儲存新的譯文,將翻譯過的所有資料以句子為單位存入我們建立的記憶庫。翻譯時系統自動對源語言進行分析,與資料庫中100%匹配的句子可自動替換,未替換匹配的句子可以根據匹配度提出翻譯建議。相同或相近的詞語或短語出現時,系統會自動搜索翻譯記憶庫中相同或相似的翻譯資源(句子、段落等),給出參考譯文。對於系統給出的參考譯文,建議修改後再使用,如果覺得句型不滿意,也可以棄之不用。對於全新的句子,我們可以根據系統提供的翻譯建議進行翻譯,而每一次的翻譯又作為積累的新資源,加入我們自己建立的記憶庫。在翻譯全新的大型項目時,翻譯速度會慢一點;但是根據我平時的經驗,大型項目的資料內容一般都有一定的重複性或類似性,所以當記憶庫積累了一定數量的專業詞彙和句型後,翻譯速度就會加快。相同的內容不用翻譯第二次。比如,我們翻譯產品的說明書,只需翻譯一個版本,在產品更新換代或出現相關產品時,部分相同或相似內容便可以直接調用。若認為記憶庫的翻譯不夠準確,可以修訂後再使用,這樣既能保證譯件的一致性,又能保證翻譯質量。

TRADOS翻譯記憶庫的記憶功能可以實現將確認後的譯文和原文導入資料庫,匹配功能可以實現翻譯過程中的自動檢索匹配。記憶功能和匹配功能相輔相成、相互依託,兩者緊密結合才能發揮各自的優勢。

記憶功能是指在翻譯過程中TRADOS自動存儲譯文,整理、建立並不斷更新記憶庫,而匹配功能則是指對比分析記憶庫裡面的源語言資料和新項目源語言文件,精確找出匹配的句子和段落,在下文出現相同或相似句段時可自動彈出記憶庫所存儲的對應譯文。句段匹配度可自行設置。比如,將匹配度設置為60%就意味著當匹配度達到60%及以上時,譯文句段會自動填充至目標語言列。我們可以直接採用或局部修改、調整譯文,將更多精力放在新內容的翻譯上。藉助記憶和匹配功能,我們可以根據現有譯文更好地理解原文,產出合格譯文,保持同一類文本的前後一致性;當出現重複句段時,也不用重複操作,這樣可以節約大量時間和精力,從而提高翻譯的產出效率、整體質量和一致性。

值得一提的是TRADOS還支持網絡共享記憶庫功能。當多人同時合作同一翻譯項目時,可以通過區域網共享一個翻譯記憶庫,每個在線的translator都可以實時調用團隊其他人員的翻譯結果。這無疑是提高團隊生產效率的法寶之一,省去了大量統一譯文風格的工作,也能最大程度避免表述不一的問題。

記憶庫好比一位老師,在我們工作的時候不時地指出哪些句子應該如何翻譯,當然這都是建立在事先建好記憶庫的基礎上的。使用TRADOS之後,我便將我所翻譯的稿件按照不同種類建立了記憶庫,將所有的同類型稿件都存儲在了相應記憶庫中,每次翻譯時都會調用相應的記憶庫,不斷將新資料更新到記憶庫中去。同樣,公司經過多年經營,已經有了部分穩定的客戶群,產品類型也相對穩定,我們也會按照不同種類的產品,建立記憶庫,在翻譯類似產品文件時調用記憶庫,這樣既能保證效率又能保證質量。

另外,使用TRADOS分析文件時能統計重複字數(不需要翻譯字數)和不匹配字數(翻譯任務)。根據匹配率的不同,TRADOS會計算出各個匹配區間的字數和字符數,而且每一項翻譯任務都顯示翻譯進度和文件路徑,便於項目管理。

使用TRADOS翻譯時,需要在編輯器界面進行。TRADOS默認每個句子為一個翻譯單元,並自動將文件按照翻譯單元切分。每翻譯完一個句子,Ctrl+Enter確認翻譯完畢,編輯器界面出現鉛筆打勾圖標,表示100%翻譯完畢,若有比分疏漏(表示譯文存在疏漏,如標記等),則不顯示該圖標,這就使翻譯工作進度一目了然。在使用TRADOS打開word文件進行翻譯時,可以預覽正在翻譯的文件,在編輯器最右側以word界面同步顯示翻譯進度,這大大增強了可視性,並且在word界面顯示的譯文與原文格式完全相同。

以上主要從記憶功能、匹配功能、文件分析及編輯可視性幾點說明了我對TRADOS在翻譯實踐中的運用認識。鑑於傳統翻譯模式與機器輔助翻譯軟體的結合已是翻譯行業發展的趨勢,所以,不論是專業的翻譯公司還是想要長期立足於翻譯行業的翻譯個體,都建議緊跟行業發展的潮流,掌握一種或多種計算機輔助翻譯軟體,由此我們的翻譯工作才會更加如魚得水,如虎添翼,大大提高翻譯效率、翻譯質量,最終滿足客戶翻譯稿件數量大、時間緊的需求。

*** END ***

圖/網絡

本文曾刊載於《訊號》總第13期 ——《譯中人》

相關焦點

  • Atman 劉昌芳:醫學機器翻譯與機器寫作
    演講者為 Atman 產品負責人劉昌芳,為方便閱讀,「KnowingAI知智」進行了不影響原意的編輯。Atman 產品負責人劉昌芳Atman 是一家由微軟亞洲研究院(MSRA)和微軟 Bing 的人工智慧專家創辦的公司,60% 的同事來自微軟。我們為醫學領域用戶提供機器翻譯、機器寫作、知識圖譜和大數據人工智慧產品,致力於成為醫學領域的語言智能專家。
  • 埃克賽特大學翻譯研究碩士MA專業介紹
    翻譯課程覆蓋的語種包括中文及歐洲語系語言﹙含法、德、意、俄、西五個語種﹚,並且與埃克塞特大學的阿拉伯-伊斯蘭研究,阿拉伯語-庫德語研究所合作提供阿拉伯語和庫德語翻譯訓練。課程授課師資均為業內著名文學翻譯家,經驗豐富的譯者或計算機輔助翻譯工具的專家。
  • 世界智慧財產權日:科專笑飛人工智慧機器翻譯 日語新品發布
    (主辦方供圖)  發布會上,國家知識產權局副局長甘紹寧對出版社機器翻譯發布會的成功舉辦表示祝賀。他表示,出版社響應國家之需、社會所求,開發出達到國際一流水平的機器翻譯系統——科專笑飛機器翻譯系統。它大大節約了人員成本和時間成本,提高了翻譯精準度和翻譯效率,切實加快了我國機器翻譯領域創新發展的進程,為全社會的智慧財產權工作者帶來了福音。科學技術是世界性、時代性的。
  • 2020年首屆線上中日機器翻譯論壇圓滿落幕
    著名經濟評論家、作家莫邦富著名經濟評論家、作家莫邦富主持了開幕式,他說:「機器翻譯已經發展到了一個不容忽視的程度了。儘管目前還存在著許多不盡人意之處,但就像火車當年問世時,還趕不上馬車的速度,可如今已經進化到了磁懸浮列車這樣超高端的交通工具了。所以,我們需要密切關注機器翻譯這個新領域。
  • 陽光學院打造「語用神經網絡機器翻譯」系統
    近日,在陽光學院外國語與海外教育學院召開的「語料庫與語用神經網絡機器翻譯研究」專家論證會上,陽光學院「語言與智能研究團隊」演示了該系統的操作,由該團隊自主打造的「語用神經網絡機器翻譯」系統得到了與會專家的高度評價。與會專家表示:「該系統在國內傳統語言學學界是首創,對處理專業性大批量快速翻譯項目等具有實踐應用和推廣價值」。
  • 百度何中軍:機器翻譯——從設想到大規模應用
    本報告結合百度機器翻譯大規模工業化實踐,介紹機器翻譯技術進展、主要產品形式及應用,最後對未來發展進行展望。機器翻譯 —— 從設想到大規模應用何中軍博士以機器翻譯設想的提出為開篇,緊接著對機器翻譯歷史進行了簡要回顧。
  • 落地機器翻譯服務,Atman推出TransGod翻譯工具
    數據顯示,2014年全球翻譯行業市場規模大達到371.9億美元,同比增長6.23%,預計2020年將達到530億美元左右。近年來,隨著算力的大幅提升,大型語料庫、記憶庫的出現,深度學習算法成熟,機器翻譯技術出現了長足進步。利用機器翻譯相關技術以提升人類譯者的工作效率成為可能。我們此前報導的國內初創公司Atman就在做機器翻譯技術及應用方向的創新。
  • 人工翻譯 or 機器翻譯?這份來自歐盟的調查可能出乎你的預料
    歐盟委員會發布的一項針對2800多家中小企業的調查顯示,近40%的受訪者在這項研究之前沒有使用過機器翻譯工具。此外,雖然絕大多數中小企業在商務活動中仍然更喜歡人工翻譯,如合同談判和與其他國家的公共部門打交道等,但超過70%的中小企業表示,機器翻譯對其業務還是有幫助的。
  • 機器翻譯七十年:百度領跑神經網絡翻譯時代
    中新網12月22日電 機器翻譯距今已有70年的發展歷史。自上世紀40年代起,基於規則、實例以及統計的機器翻譯方法漸次登場,各領風騷。近兩年,神經網絡機器翻譯(Neural Machine Translation, NMT)技術異軍突起,取得了翻譯質量的大幅躍升。
  • 機器翻譯簡史:八十多年來,人類就是要再造一座通天塔
    △IBM 701然而,得意洋洋的新聞稿隱藏了一些細節,誰也沒有提到,這些翻譯的例句經過了精心的挑選和測試,排除了一切歧義。如果用到日常場景中,這個系統不會比一本單詞書強多少。就算這樣,機器翻譯的軍備競賽還是開始了,加拿大、德國、法國、日本都投入其中。軍備競賽四十年來,改進機器翻譯的努力一直持續著。
  • 百度機器翻譯獲國家科技進步獎
    1月8日,2015年度國家科學技術獎勵大會在人民大會堂舉行,百度機器翻譯項目獲頒國家科學技術進步獎二等獎,這是該獎項首次出現網際網路巨頭(BAT)的身影。   機器翻譯一直被公認為人工智慧領域最難的課題之一,百度機器翻譯的突破性成果,使我國掌握了網際網路機器翻譯的核心技術,佔領了技術制高點。
  • 機器翻譯革命強勢來襲 人類翻譯將無路可走?
    神經機器翻譯(NMT)自2014年在科學論文中首次被提及以來,已使機器翻譯領域出現翻天覆地的變化,它開始全面超越以統計模型為基礎的統計機器翻譯(SMT),快速成為在線翻譯系統的主流標配。神經機器翻譯的「神經元」可以學習和收集信息,模仿人類大腦的神經元建立聯繫。
  • 《對馬島之鬼》日文版選單有錯?被網友質疑用機器翻譯
    PS4最新獨佔大作《對馬島之鬼》即將在7月16日發售,遊戲講述著1274 年日本對馬島被蒙古入侵,以及傳奇武士的捍衛故事。但最近在各家媒體都貼出主選單畫面,公開評測的解禁日期時,就有網友發現日文版的主選單,似乎是用機器翻譯的。
  • 機器翻譯:谷歌翻譯是如何對幾乎所有語言進行翻譯的?
    第一部分簡單介紹神經網絡機器翻譯(NMT)和編碼器-解碼器(Encoder-Decoder)結構。第二部分提供了使用Python創建語言翻譯程序的詳細步驟。機器翻譯是計算語言學的一個分支,主要研究如何將一種語言的源文本自動轉換為另一種語言的文本。在機器翻譯領域,輸入已經由某種語言的一系列符號組成,而計算機必須將其轉換為另一種語言的一系列符號。神經網絡機器翻譯是針對機器翻譯領域所提出的主張。
  • 百度機器翻譯團隊獲得WMT2019中英翻譯冠軍
    8月1日,WMT2019國際機器翻譯大賽研討會在義大利佛羅倫斯召開。本屆大賽,百度機器翻譯團隊在中文-英文翻譯任務上獲得冠軍。圖1 人工評價結果WMT全稱是Workshop on Machine Translation,是業界公認的國際頂級機器翻譯比賽之一,其中中文-英文翻譯任務是歷年參賽隊伍最多、競爭最為激烈的機器翻譯任務之一。
  • 將科幻變成現實,谷歌百度用神經機器翻譯踐行人類的「巴別塔之夢」
    機器之心作者:iCombinator機器翻譯之夢今天,當我們很自然的拿出手機,選擇一個谷歌、百度或微軟的翻譯 app ,輕而易舉的完成文字翻譯、拍照翻譯和實時語音翻譯時,我們可能不會意識到由於深度學習的出現和數據量的積累,研究數十年的機器翻譯問題已經變得可用並走入了我們的生活,給我們帶來了極大便利。
  • 重磅| 谷歌大腦養成記:從識別貓到突破性機器翻譯
    選自NYT機器之心編譯谷歌如何使用人工智慧來改進谷歌翻譯等許多谷歌服務?《紐約時報》雜誌今日發布了一篇重磅長篇《The Great A.I. Awakening》全面解讀谷歌利用機器學習重塑自身的戰略。機器之心編譯時進行了適當的刪減。
  • 親測|Google翻譯內核升級:大型數據集神經機器翻譯加持 稱誤差再降...
    據Google官方提供的數據顯示,Google翻譯搭載的Google的神經機器翻譯(GNMT:Google Neural Machine Translation)系統使用了當前最先進的訓練技術,因而提升了機器翻譯水平,將翻譯誤差再度降低了55%-85%。
  • 腦機接口利器,從腦波到文本,只需要一個機器翻譯模型
    他們將腦波到文本的轉換視為機器翻譯的過程,腦波為輸入序列,文本為輸出序列。通過讓受試者朗讀文本,收集相應腦區的電波,構成訓練數據集,然後去訓練一個端到端的機器翻譯模型。通過這種方式,他們獲得了一個模型,這個模型能夠將受試者的腦波「準確」、「實時」地轉換為句子文本,而錯誤率僅為3%。
  • 百度大腦開放日召開機器翻譯專場 百度AI同傳翻譯性能可媲美人類
    機器翻譯作為人工智慧關鍵技術之一,正日益成為企業智能化升級的重要應用場景。12月1日,百度大腦開放日舉辦了以「機器翻譯 溝通全世界」為主題的專場活動。IDC中國副總裁兼首席分析師武連峰、百度AI技術生態部總經理劉倩、百度人工智慧技術委員會主席何中軍進行主題演講,同時與在場的40多位來自金融、製造、能源等行業企業信息化負責人聚焦機器翻譯的價值、企業應用需求、未來發展趨勢等話題展開深入的互動討論,分享最佳實踐經驗,助力企業更好的提升機器翻譯大規模產業化應用,推動企業智能化升級。會上,武連峰講到,企業具備全球化信息能力非常重要。