機器翻譯的最新進展與瓶頸所在

2020-12-05 東方網

  你想過和異國人說話不需要再有翻譯,只需隨身攜帶一個輕巧的數碼機器嗎?目前來看這仍是奢望。不過,或許某一天,我們終於可以不再學習頭疼的外語就能實現和外國人的無縫交流。

  機器翻譯是一個充滿挑戰的研究領域,正因為難度很大,它被列為21世紀世界十大科技難題之首。一路走來,機譯經歷了艱難而曲折的發展歷程,既有成功和興奮,也有挫折和困惑。

  然而,需求永遠走在應用的前方。由於近年來全球化進程的加速以及國際交流的日趨頻繁,人們對於翻譯的需求空前增長。而網際網路的普遍應用則使在線翻譯成了當今機譯的重頭戲。

  在這一領域,競爭正變得空前激烈。如今功能較強、方便易用的在線翻譯工具有谷歌翻譯、必應翻譯、臉譜翻譯、寶貝魚翻譯、巴比倫翻譯等,其中後起之秀的谷歌翻譯最具特色,同時最具代表性。

  谷歌翻譯目前可提供63種主要語言之間的實時翻譯;它可以提供所支持的任意兩種語言之間的互譯,包括字詞、句子、文本和網頁翻譯。另外它還可以幫助用戶閱讀搜索結果、網頁、電子郵件、YouTube視頻字幕以及其它信息,用戶甚至還能在Gmail內進行實時的多語言對話。

  谷歌翻譯主要是採用統計翻譯模型,往計算器內輸入大量的文字文本,包括源語言的文本,以及對應目標語言人工翻譯的文本,通過海量統計數據來提高翻譯精確度。

  之所以採用統計翻譯模型,一個重要原因是,谷歌翻譯採用了雲計算架構。該架構擁有谷歌研發的分布式計算系統(MapReduce)和分布式存儲系統(BigTable);而這兩個系統很有創造性,而且有極大的擴展性,使得谷歌在系統吞吐量上有很大的競爭力。

  機譯更激動人心的應用,在於日常對話中的實時翻譯。這一領域同樣是谷歌領先;它擁有較強的語音識別技術,可以通過聲音實現自動檢索,再將語音識別和機譯結合在一起。

  2011年11月,谷歌最新推出了一款手機翻譯軟體;該軟體支持包括漢語普通話在內的14個語種。對著谷歌Android智慧型手機講話的用戶,幾乎能實時聽到他們的源語言被翻譯成目標語言;而通話對方的語言也會被翻譯成該用戶的母語。

  谷歌董事長埃裡克施密特稱,這種手機翻譯服務將會得到極大改善,甚至可能進行「同聲傳譯」;其前景是令人樂觀的。

  谷歌的首席科學家阿施斯維努戈帕爾稱,谷歌的最終目的是研發出能夠翻譯全球至少10億人所說的300種語言的手機軟體。

  除了傳統的翻譯思路,一種被稱為解碼外語的新方法也小荷露出尖尖角。

  這項由南加州大學的科學家們提出的全新機譯方法把英語視為一種初始語言,而需要翻譯的外語類似一種加密後的高級文字,通過解碼破譯,把外語「破解」,變成英語。

  不過,現實是骨感的。目前,這種翻譯方法只能翻譯一些短句或電影字幕,尚未運用到長句或片段翻譯中,但它卻給機譯研究打開了一條新的思路,且可以運用到任何一種語言中。科學家們稱,因為不需要任何既有的文本為基礎,這種翻譯方法今後甚至可以對「海豚音」或「外星人語言」進行破譯。

  事實上,不論哪種方法,影響機譯發展的最大因素在於譯文的質量。就已有的成就來看,機譯的質量離終極目標仍相差甚遠。

  中國數學家、語言學家周海中曾在論文《機器翻譯五十年》中指出:要提高機譯的質量,首先要解決的是語言本身問題而不是程序設計問題;單靠若干程序來做機譯系統,肯定是無法提高機譯質量的。

  同時,他還指出:在人類尚未明了「人腦是如何進行語言的模糊識別和邏輯判斷」的情況下,機譯要想達到「信、達、雅」的程度是不可能的。這也是制約機譯質量提高的一大瓶頸。

  值得一提的是,美國發明家、未來學家雷科茲威爾最近在接受《赫芬頓郵報》採訪時預言,到2029年機譯的質量將達到人工翻譯的水平。對於這一論斷,學術界還存在很多爭議。

  不論怎樣,目前是人們對機譯最為看好的時期,這種關注是建立在一個客觀認識和理性思考的基礎上的。我們也有理由相信:在計算器專家、語言學家、心理學家、邏輯學家和數學家的共同努力下,機譯的瓶頸問題將會得以解決。

相關焦點

  • Memsource翻譯軟體,為你提供最佳機器翻譯引擎
    在人工智慧高速發展的今天,機器翻譯技術取得了突破性進展,市面上湧現了大量的商家提供機器翻譯服務,機器翻譯的質量在不同行業、語種下的差距越來越大。而在進行翻譯時,所選擇的機器翻譯引擎是影響翻譯效果的重要因素。因此,如何選擇翻譯引擎是我們面臨的重要任務。
  • 重築巴別塔:機器翻譯的夢想與現實
    引言:技術的新進展使人們對機器翻譯的關注與熱望達到前所未有的高度。本報記者採訪一線專家,為你全面解讀關於機器翻譯的那些事兒:  宇宙翻譯器:究竟要多久才能出現?  10月底,微軟首席研究官、微軟研究院院長裡克·雷斯特博士(見右圖)在天津舉辦的「21世紀計算大會」上展示了微軟最新的研究成果——同聲傳譯軟體,向世人描繪了一幅「跨越語言、溝通無礙」的美好藍圖。
  • 百度翻譯閃耀MIT年度科技大會 吳華現場展示翻譯機
    百度自然語言處理部首席科學家、技術委員會聯席主席吳華博士受邀發表題為「Breaking Barriers with Machine Translation」的報告,介紹了百度機器翻譯的最新技術進展及創新產品。據悉,百度是此次機器翻譯領域唯一被邀請出席的企業。MIT Technology Review隨後發文詳細報導了這次演講,稱讚百度作為中國網際網路巨頭在提高機器翻譯上取得的重大進展。
  • 百度翻譯閃耀MIT年度科技大會,吳華現場展示百度WiFi翻譯機
    百度自然語言處理部首席科學家、技術委員會聯席主席吳華博士受邀發表題為「Breaking Barriers with Machine Translation」的報告,介紹了百度機器翻譯的最新技術進展及創新產品。百度是此次機器翻譯領域唯一被邀請出席的企業嗷!
  • 如何評價Google神經機器翻譯(GNMT)系統?
    最新宣布發布穀歌神經機器翻譯(GNMT:Google Neural Machine Translation)系統,在官方博客中Google稱該系統使用了當前最先進的訓練技術,能夠實現到當下機器翻譯質量上最大的提升。
  • 機器輔助翻譯之TRADOS知多少
    然而,傳統的純人工翻譯方式因成本高、耗時長等原因似乎已經不能滿足翻譯市場某些客戶稿件數量大、時間緊的需求。於是,機器輔助翻譯應運而生。那麼,什麼是機器輔助翻譯呢?在說機器輔助翻譯之前,我先說下我對機器翻譯的理解。機器翻譯(Machine Translation,簡稱MT)是利用計算機把一種語言轉變成另一種語言的過程,是由機器自動完成的。
  • 人工智慧再下一城:機器翻譯提前7年達到人類專業翻譯水平
    機器翻譯提前7年超越人類譯者,人工智慧再下一城機器翻譯是科研人員攻堅了數十年的研究領域,曾經很多人都認為機器翻譯根本不可能達到人類翻譯的水平。2017年中旬,牛津大學面向機器學習研究人員做了一次大規模調查,調查的內容是他們對 AI 進展的看法。
  • 谷歌AI新進展:自然語言與翻譯加入AutoML
    [導讀]近日,谷歌雲首席科學家李飛飛在GoogleCloud Next 18大會上公布了一系列最新的人工智慧產品進展
  • 谷歌發布神經機器翻譯,翻譯質量接近筆譯人員
    據外媒報導,谷歌於昨日發布了網頁版本和移動版本的谷歌翻譯。在漢譯英的過程中,谷歌翻譯會採用全新的神經機器翻譯機制,而這個App每天要進行一千八百萬次這樣的翻譯。此外,谷歌針對這個神經機器翻譯系統的運作原理,專門發表了一篇學術論文。
  • 深度學習 Memory & Attention 技術最新進展 (75PPT下載)
    原標題:深度學習 Memory & Attention 技術最新進展 (75PPT下載) 新智元編譯1 來源作者:Stephen Merity 編譯:弗格森 【新智元導讀】Memory 和 Attention 技術目前在深度學習中得到了較為廣泛的採用,本文總結了這兩項技術的最前沿進展
  • 搜狗機器翻譯團隊獲得 WMT 2017 中英機器翻譯冠軍
    近年來,幾乎所有的研究機構在發表關於機器翻譯新方法的論文時,都會以 WMT 數據集作為實驗數據,並以 BLEU 評分來衡量方法的有效性,給出一個量化的、可比的翻譯質量評估,因此,WMT 數據集已經成為機器翻譯領域公認的主流數據集。
  • 搜狗獲WMT2017國際翻譯大賽雙向冠軍 可滿足多種場景下的實時翻譯...
    ,不遺餘力地推進深度學習在機器翻譯領域的研發和應用。能夠識別語音的機器翻譯正在逐漸從實驗室走向普羅大眾,搜狗語音交互中心技術總監陳偉表示,機器翻譯在搜狗輸入法上的語音翻譯、中譯英功能和搜狗同傳已經應用,流量已超過200多萬。可滿足多種移動場景下的實時翻譯需求,為用戶提供「口袋裡的翻譯專家」。而作為搜狗人工智慧重要布局,未來圍繞著語音交互入口,搜狗在更多領域都會有進一步的進展。
  • 古文字被AI破譯,MIT和谷歌開發失傳語言的機器翻譯系統
    通過機器學習繪製特定語言的聯結 不難想像,近年來機器翻譯的最新進展對此有所幫助。 短短幾年內,注釋資料庫和讓機器從中學習的技術讓語言學習發生了革命性變化,這使得機器翻譯變得越來越普遍。儘管翻譯質量有待提高,但這也提供了思考語言的一個全新角度。
  • 未來的世界:機器翻譯VS人工翻譯
    蔡基剛:在特定領域的機器翻譯替代人工翻譯是技術發展的必然趨勢,而且在醫學、生物、法律、航天、海事等專業領域裡的機器翻譯取代大部分人工翻譯將是最近幾年的事情。這個語料加工的技術層面工作,可以讓專業人員(懂英漢兩種語言的法律專業人員)和語言服務專家完成,包括對機器翻譯的譯文進行與原文的比較和校對,然後修改後輸回機器,再讓其進行再學習翻譯,再修改和完善語料庫文本。這樣,隨著機器翻譯實踐的不斷增加,這款專業翻譯機器的準確率達到90%甚至以上不是不可以做到的。翻譯內容越專業,場景或任務越固定,標準越統一,翻譯準確率就越高,替代人工翻譯不是不可能。
  • 翻譯行業的發展方向:機器翻譯VS人工翻譯
    近年來,機器翻譯技術有了很多新的突破,在實際的語言服務實踐中,機器翻譯有了很多成功的案例。機器翻譯必將深刻影響翻譯服務行業,將給人工翻譯帶來實際的威脅。另一方面,機器翻譯以其人工翻譯難以比擬的速度,將提高人類對於海量信息的處理能力,彌補人工翻譯在速度和成本方面的不足。不管你喜不喜歡,你都無法迴避機器翻譯的發展。如何利用機器翻譯技術成了翻譯服務行業的重要課題。
  • 多家翻譯軟體大型翻車現場?機器翻譯到底有哪些不確定性
    具體表現是,在機器翻譯的世界裡,一直無法賦予機器足夠的「靈性」。例如,林則徐虎門銷煙被某度軟體翻譯成了「Lin Zexu sells cigarettes in Humen」 。圖註:筆者後續對百度進行測試時,發現已經是正確翻譯:「Lin Zexu destructed opium at Humen」顯然,機器把「銷」等同於「銷售」。
  • 機器翻譯正走入現實生活 未來還需要人工翻譯嗎?
    上周美國市場觀察網站上的一項調查顯示,對計算機翻譯的需求激增,預測到2024年歐洲的機器翻譯市場將超過3億英鎊(1英鎊約合8.76元人民幣——本網注)。谷歌翻譯支持100多種語言,每天有5億人使用谷歌翻譯。微軟翻譯提供11種語言的會話翻譯,而且提供多種語言同時翻譯。
  • 紀念機器翻譯概念的誕生:重新認識瓦倫·韋弗先生
    作者 | 張家俊編輯 | 叢 末機器翻譯旨在利用計算機實現自然語言之間的自動翻譯,一直是自然語言處理與人工智慧領域的重要研究方向,近年來更是取得了突破性進展,已成為大眾較為熟知和常用的技術。現在一提起機器翻譯技術的起源,對該研究領域稍有了解的人們都知道是美國的瓦倫·韋弗(Warren Weaver,後面簡稱韋弗)最先於1947年提出機器翻譯概念並於1949年7月正式記錄於名為《翻譯》的備忘錄。不過,可能大多數人不是特別了解韋弗究竟是何許人也以及他怎麼會提出機器翻譯的概念。
  • 王維、楊絳與機器翻譯的本質
    沃倫·韋弗認為翻譯是一個解碼的過程,這個解碼的過程,有一個正確的答案。同時他認為機器翻譯能夠「理解」這個密碼所代表的意思。 從1947年到現在,又發生了什麼?其中有一篇文章就是1959年由Yehoshua寫的文章,他雖然對機器翻譯有多年研究,但最終對機器翻譯持批評的態度,不過他對於機器翻譯的可能性卻持有比較曖昧的態度。
  • 百度AAAI 2018錄用論文:基於注意力機制的多通道機器翻譯模型
    百度機器翻譯團隊在 arxiv.org 上發布了最新研究成果「Multi-channel Encoder for Neural Machine Translation」,這一論文已被 AAAI 2018 錄用。