探測機器翻譯的「溫度」

2020-12-25 中國社會科學網

機器翻譯(Machine Translation,MT)以科技為原動力,越來越頻繁地應用於金融、商貿、教育、旅遊等各行各業。不少信息技術公司推出了一系列機器翻譯系統及實體翻譯終端,不斷顛覆著人們所熟知的「紙—筆—人」的傳統翻譯模式,為翻譯行業注入了新的活力,同時也為世界不同語言地區的經濟貿易、跨文化交流等帶來巨大便利。

隨著機器翻譯的不斷發展,機器翻譯將取代人工翻譯之言論甚囂塵上,一些翻譯從業者對自身的發展前景充滿了焦慮,並對機器翻譯本身具有「排斥、恐懼」的心理。那麼,在機器翻譯的衝擊下,人工翻譯真的就要走向落寞,甚至最終被完全取代嗎?我們應以理性態度論證此辯題的真偽。新的翻譯方式的出現,並不代表著傳統翻譯方式的滅亡。人工翻譯的生存與毀滅,取決於其是否具有不可取代性,以及能否融入科技發展的洪流之中,與機器翻譯攜手共進。

祝朝偉認為,機器是否會取代譯者的問題之所以成為爭論焦點,本源在於人的慣性思維,這種思維有意識地把科技的進步與人文因素的發展列為對立面。我們可以從翻譯實踐中得知,機器翻譯與人工翻譯之間的關係不是對立而是相互依存,換言之,科技和人文有機的結合,才是二者未來的發展大趨勢。從機器翻譯技術的發展現狀及其潛存的人文因素中,能夠探測到「冰冷」的機器翻譯背後「溫暖」的人文因素。

機器翻譯的原理是,利用計算機系統自動將源語文件轉換成目標語文件,涉及語言學、高等數學、信息理論、計算機科學等多個學科。機器翻譯技術,包括語料庫、算法處理、機器計算性能等部分。其中,語料庫是基礎;算法處理是機器翻譯表達習得知識的手段,是其核心,主要採用規則庫方式與參數化方式兩種算法;計算性能是計算機自身具有處理數據運算的能力。自1947年問世以來,機器翻譯經歷了起步、衰微、復甦與繁榮的發展階段。其工作機制可分為規則機翻(Rule-based MT)、統計機翻(Statistics-based MT)和神經機翻(Neutral MT)三代機翻模式。2015年,百度公司就發布「百度機器翻譯」系統,融合了規則機翻和統計機翻的技術,大大提升了翻譯效果。2016年,谷歌公司提出「神經機器翻譯」系統的概念,並終止了之前的規則機器翻譯和統計機器翻譯技術,使誤差率大幅度降低。對於比較規範的文本,機器翻譯的譯文與人工翻譯已不分伯仲。計算機系統看似是智能化自動翻譯,但機器翻譯過程中的不同階段都存在著不同程度的人文因素。

最早的機器翻譯技術採用規則模式,主要是建立翻譯規則庫,需要大量的人力擬定海量的語言規則,其工作流程是按照庫中已有的規則,將源語言轉換為目標語言。

為解決規則模式中機器翻譯的缺陷,統計模式的機器翻譯應運而生。人們將算法處理方式轉向參數統計方式,在積累了大量概率參數後,建立一組統計語言模型,這樣機器就可通過此統計語言模型中藉由比較參數大小,智能選擇符合當下條件的語言表達方式。此模式節省大量人力去建立翻譯規則庫,根據語料庫中所習得的語料,通過參數統計的處理方式將源語言轉換成目標語言。但該模式需要人參與管理參數控制的機制,即統計語言模型(語料庫),可是語料庫建設的滯後性阻礙了統計機器翻譯模式的發展。黃友義曾指出,在人文領域中,很多新的觀念及其表述等缺乏完備的資料庫,所以機器難以應對此類翻譯,還是需要依靠譯員。

神經機器翻譯系統的工作機制非常獨特,利用神經網絡系統在源語和目標語之間進行直接「端對端」的映射轉換。此模式下會得到比前兩代機器翻譯更高質量的譯文,已廣泛使用於應用型文本的翻譯中。對比人工翻譯,神經機器翻譯大大縮短了翻譯時間。但是,即便是再先進的神經機器翻譯系統,也無法完全擺脫人類進行翻譯並提供成品譯文,還需譯者進行譯後編輯,包括校對、排版等來滿足客戶的需要。

無論哪一代的機器翻譯,其主體都是機器,其無法獨立完成翻譯工作。不論是規則庫還是語料庫,或是神經網絡的建立,都是以人類為基礎建立起來的。機器翻譯中譯者的作用表明,機器翻譯還不能替代人或離不開人的參與。機器的製造、更迭和使用是受人控制的。對於富含隱喻性、充滿人類豐富情感的文學作品的翻譯,缺乏文化感知能力的機器翻譯幾乎無法施展拳腳,機器翻譯的質量也無法與專業譯員相提並論。查明建認為,譯者的主體性是指譯者充分尊重翻譯對象並完成翻譯目標所表現出的主觀能動性,即譯員所具有的文化意識、人文品格和創造性。在文學作品翻譯中,機器翻譯的譯文缺乏譯員所體現的個性化與人文化。

在計算機技術飛速發展的今天,機器翻譯所具有的特殊工作機制仍離不開人的參與,而機器翻譯的譯文在文學翻譯等領域尚依賴於人工對其進行二次編輯。換言之,人類不斷研發機器翻譯技術的最終目的,是為了讓機器更好地輔助譯者進行翻譯,而不是取代人工翻譯。機器翻譯並不是脫離人獨立工作的「冰冷」個體,很大程度上仍需要人的參與,即人工「溫暖」的智能機制。在人類社會漫長演變過程中,人文因素的方方面面都根植於特定社會中每一個人的思想深處,是人類進行溝通與交流的思想基礎。與人工翻譯相比,機器翻譯的最大劣勢就是很難譯出充滿人文價值的語言文字。要想獲得高質量的譯文,只有將機器翻譯與人工翻譯相融合,這或許也是譯者的發展前景。

(作者單位:陝西科技大學文理學院)

來源:中國社會科學網-中國社會科學報 作者:任慧君 陸綺婧

精彩推薦:

探索方言文化研究新範式

制度優勢是黨和國家的最大優勢

基于田野實踐構建中國政治學理論

歡迎關注中國社會科學網微信公眾號 cssn_cn,獲取更多學術資訊。

相關焦點

  • 從科技文章的在線翻譯看人工智慧在機器翻譯領域的發展
    文章專業嘛,就用有道新版查單詞,CTL+C可以翻譯,一看翻譯結果非常震撼,簡直是完全正確。有道網易的,竟然如此高質量,出人意外。作為一直的萬物好奇者,忍不住用鮑教授網上的科技素材拿有道、微軟、百度與谷歌去翻譯。還有意外的是,我們可以使用谷歌翻譯。科技文章的特點是科技偏詞多但岐義少,語法規範但複雜語法有時多,通常情況下對於機器翻譯更容易。
  • 是德科技示波器新增兩款極限溫度探測解決方案
    該探頭具有高達 400 MHz 的帶寬,非常適合在溫度艙內探測電信號。這兩個探測解決方案可與 Keysight InfiniiVision 和 Infiniium 系列示波器兼容。是德科技現在提供廣泛的示波器極限溫度探測解決方案,供您任意選擇。
  • 機器翻譯思想提出71周年|破土而出的機器翻譯
    原標題:機器翻譯思想提出71周年| 破土而出的機器翻譯1949年7月15日,利用計算機進行語言自動翻譯的想法被提出,機器翻譯的種子從那時起生根發芽,逐漸枝繁葉茂。如今,我們更是常常躲在它的樹蔭下,享受著技術帶來的便利。
  • 機器翻譯簡史
    所以無論是現實中,還是科幻電影中,人們一直希望能有一個機器,讓人不學外語也能暢快溝通。隨著技術進步,這個夢想正在一步步成為現實。來自俄羅斯的Ilya Pestov,最近寫就了一篇《機器翻譯簡史》,較為完整地回顧了人類過去幾十年來在機器翻譯方面的探索和努力。
  • 機器翻譯與人工翻譯之爭
    機器翻譯這一自然語言處理領域最具挑戰性的研究任務,則是自然語言處理領域「皇冠上的明珠」。近年來,機器翻譯發展十分迅猛,但對於機器翻譯與人工翻譯孰優孰劣、機器翻譯能否取代人工翻譯,一直存在爭議。機器翻譯之父韋弗曾提出「翻譯即解碼」的結構主義觀點,但是,數年之後,他自己又推翻了這一論斷,表示「機器成不了普希金,機器翻譯永遠都無法傳達出語言本身的優雅與格調」。
  • Atman 劉昌芳:醫學機器翻譯與機器寫作
    2016 年 1 月在北京成立,早於 2016 年 9 月谷歌發布的神經機器翻譯(GNMT),Atman 完成了機器翻譯系統首秀。2017 年 7 月,Atman 與強生籤約,同年 12 月我們開始研發醫學領域的機器寫作。
  • 搜狗機器翻譯團隊獲得 WMT 2017 中英機器翻譯冠軍
    近年來,幾乎所有的研究機構在發表關於機器翻譯新方法的論文時,都會以 WMT 數據集作為實驗數據,並以 BLEU 評分來衡量方法的有效性,給出一個量化的、可比的翻譯質量評估,因此,WMT 數據集已經成為機器翻譯領域公認的主流數據集。
  • 機器翻譯的夢想與現實
    近年來,隨著計算機性能的提高,雲計算、大數據和機器學習等相關技術迅速發展,人工智慧再度崛起,機器翻譯重新成為人們關注的焦點。一時間,機器翻譯系統如雨後春筍般湧現,各種報導隨之呈井噴式爆發,「機器翻譯將取代人類」的說法也時有耳聞。然而,機器翻譯的真實水平如何,夢想與現實的距離到底有多遠?
  • 未來的世界:機器翻譯VS人工翻譯
    蔡基剛:在特定領域的機器翻譯替代人工翻譯是技術發展的必然趨勢,而且在醫學、生物、法律、航天、海事等專業領域裡的機器翻譯取代大部分人工翻譯將是最近幾年的事情。這個語料加工的技術層面工作,可以讓專業人員(懂英漢兩種語言的法律專業人員)和語言服務專家完成,包括對機器翻譯的譯文進行與原文的比較和校對,然後修改後輸回機器,再讓其進行再學習翻譯,再修改和完善語料庫文本。這樣,隨著機器翻譯實踐的不斷增加,這款專業翻譯機器的準確率達到90%甚至以上不是不可以做到的。翻譯內容越專業,場景或任務越固定,標準越統一,翻譯準確率就越高,替代人工翻譯不是不可能。
  • 挑戰CET6翻譯考試的機器翻譯系統
    說它特殊,是因為「考生」只有一個,而且是一套機器翻譯系統。考題來自三天前剛結束的大學英語六級(CET6)考試,評分的是兩位具有六級閱卷經驗的高校資深專家。「考生」一口氣做了三道翻譯題,每道題滿分15分,它得到13分的均分,每題用時只有5秒。「這套機器翻譯系統的表現讓我們驚喜,翻譯得很地道。」對於成績,專家的鑑定是:優秀!
  • 小牛翻譯,做最好的機器翻譯發動機
    2009年,團隊第一次使用統計機器翻譯技術參加國內規模最大、歷史最長的機器翻譯比賽—CWMT評測,取得了漢英新聞翻譯系統第二名的成績,僅以微弱的差距落後於微軟亞洲研究院。在這次評測大會上,朱靖波教授注意到,絕大多數參賽單位都在使用英國愛丁堡大學的Moses開源統計機器翻譯系統做優化,但是系統並沒有針對以中文為核心的翻譯任務進行調優,造成許多參賽單位的比賽結果並不理想。
  • 機器翻譯「走紅」憑實力
    近日,第四屆機器翻譯論壇在杭州召開,與會者分享了機器翻譯前沿的研究和應用成果,探討機器翻譯技術發展機遇與挑戰,人工智慧和翻譯的融合又成為市場關注的熱點。數據顯示,目前全球語言服務市場潛力很大,機器翻譯更是市場上的「紅人」,2018年機器在線翻譯量每日高達8000億至1萬億個詞語。同時,我國機器翻譯市場需求與日俱增,主要集中於企業用戶,涉及石化、機電、交通運輸、金融、旅遊等多個垂直領域。「傳統翻譯服務模式為勞動密集型,機器翻譯則在前期就輔助產業鏈上的各環節,提高了效率。」
  • 機器翻譯+人工翻譯,認識翻譯之美
    每年9月30日是國際翻譯日,是全體從事翻譯工作者的節日。在以往,人工翻譯佔主流,如今機器翻譯和人工翻譯相輔相成,共同推進世界範圍內的翻譯工作。對於不從事翻譯工作的人來說,他們認為翻譯只是不同語言之間的轉換,從語法語義角度將源語言轉換成為目標語言。對於從事翻譯工作的人來說,翻譯不僅僅是語言之間的轉換,更是對於另外一種語言的認知與理解,是將融入了個人情感在裡面,而不是乾巴巴的翻譯了事。正如一些翻譯學家所說的,翻譯外國小說就是一個重新創造的過程。
  • 翻譯行業的發展方向:機器翻譯VS人工翻譯
    (原標題:翻譯行業的發展方向:機器翻譯VS人工翻譯) 近年來,機器翻譯技術有了很多新的突破
  • 一個能探測溫度的手機外接攝像頭要怎麼玩?
    不久前我們曾經介紹過通過充電口連接 iPhone 的 DxO One 外接相機,如果說它給 iPhone 帶來更強大的拍照性能的話,這款能幫助你探測周圍的溫度並生成熱成像圖的 Flir One 就是來擴展手機攝像頭的實用性的。它由兩個攝像頭組成,其中一個攝像頭能感應紅外線,解析度為 160×120。
  • 人工翻譯是否會被機器翻譯取代
    版權系晨輝翻譯所有,如需要轉載,請聯繫晨輝翻譯!隨著科技的發展,翻譯機的誕生,解決了很多的問題。甚至很多地方都在使用機器翻譯,但是在某些專業領域上仍然很難實現意義上的改變。人工翻譯真的有那麼不堪嗎?雖然科技不斷的進步,很多機器的發明都已經代替了人工,但翻譯機真的有望取代人工翻譯嗎?在2018年4 月 9 日,騰訊翻譯君火了,起因是一場發生在今年博鰲亞洲論壇的「同聲傳譯車禍」
  • 越來越聰明的機器「翻譯家」
    機器翻譯,英文為Machine Translation,又稱為自動翻譯,就是通過計算機,把一種自然語言(如中文)變成另外一種自然語言(如英語),這樣一個轉換的過程。通過機器進行翻譯的設想很早就有,而直到世界上第一臺電子計算機ENIAC誕生,這一設想才成為可能。
  • 機器翻譯產品全景圖
    ——古語機器翻譯在2018的科技媒體絕對是一個高頻詞。以上只列舉了部分,提供機器翻譯私有部署服務的還有橙譯中科、傳神、語智雲帆、歐米翻譯等公司。比如中譯語通轉向大數據,愛特曼科技轉向醫療(同類公司還有具備人機翻譯背景的深度智耀),百度翻譯、搜狗翻譯也」橫插一腳「提供私有化部署服務。三、機器翻譯+具體使用場景1. 信息發布場景CAT(計算機輔助翻譯):除了翻譯記憶庫,這個「古老」工具最大變化之一是機器預翻譯以前是免費的,現在開始收費了,畢竟機器翻譯越來越靠譜了。
  • 機器翻譯、詞典與英語學習
    在寫這篇短文之前,我有這樣幾個基本的觀點:1) 無論當下的機器翻譯質量與人的譯文相比孰優孰劣,機器翻譯從本質上都能幫助我們了解母語之外的其他語言文字
  • 王維、楊絳與機器翻譯的本質
    沃倫·韋弗認為翻譯是一個解碼的過程,這個解碼的過程,有一個正確的答案。同時他認為機器翻譯能夠「理解」這個密碼所代表的意思。 從1947年到現在,又發生了什麼?其中有一篇文章就是1959年由Yehoshua寫的文章,他雖然對機器翻譯有多年研究,但最終對機器翻譯持批評的態度,不過他對於機器翻譯的可能性卻持有比較曖昧的態度。