Google 翻譯的「漢譯英」錯誤率降低 60%,是怎麼算出來的?

2020-12-08 雷鋒網

第一步。

從維基百科和新聞網站上,隨機選取 500 個中文句子,作為被評估內容。

第二步。

找人工翻譯,將500個句子翻譯為英文。

第三步。

將舊的機器翻譯結果、新的機器翻譯結果(神經網絡)、人工翻譯的結果、,這三份「考卷」,拿給熟練使用中英雙語的真人判卷員。

第四步。

熟練使用中英雙語的真人判卷員,給每張考卷的每個句子,進行打分。分數為 0~6 的整數,0代表翻譯結果「狗屁不通」,6代表翻譯結果「精彩絕倫」。

第五步。

出成績了。舊機器翻譯每個句子平均得分 3.694,新機器翻譯得到 4.263 分,人工翻譯得分 4.636 分。別忘了滿分是 6 分哦。

第六步。

分別計算,跟人工翻譯的水平相比,「誤差率」(錯誤率)是多少。

第七步。

算「錯誤率」降低了多少。

(20%-8%)/ 20% = 12% / 20%= 60%

第八步。

算算「準確率」提升了多少。

(4.263-3.694)/3.694 = 15%

第九步。

為什麼用戶興奮,媒體興奮,專家沒那麼興奮?翻譯公司商鵲網CTO魏勇鵬告訴雷鋒網(公眾號:雷鋒網)

這裡面兩個主要的「陷阱」:

1、從3.6提升到4.2,和從4.2提升到4.6,這兩個所需要付出的努力程度,後者可能是前者的10倍以上都不止,但Google就簡單的線性計算為縮小了60%的差距。


2、中英的人工翻譯,得到的評分也就只是4.6,比英西的人要低得多,這點說明用來作為基準的「人」,未必是靠譜的,以它為基準來評估,也未必是靠譜的。

其實還有第三點,別忘了卷子是 Google 自己出的。

注意用於做評測的數據是:500 randomly sampled sentences from Wikipedia and news websites。這些都是網際網路上語料最充足的內容類型。也就是機器最擅長的內容。

第十步。

行業認可的一種機器翻譯成績評估,是 WMT 的 BLEU Score 比賽。Google 這次發布的論文,也用了 BLEU Score 的分數。雷鋒網沒找到漢譯英的部分,但是有英譯法的數據,從 37 分提升到 41.16 分。

第十一步。

很多人類患上「圍棋」恐慌症了。

Google 首次將神經網絡技術,成功應用到翻譯產品上,上線後使得翻譯質量有了明顯提升。但是媒體報導中的標題「錯誤率降低 60%」,甚至某種語言是 「85%」,很容易讓普通人以為蒸汽機革命來了……事實上,微軟、百度等大公司之前也在翻譯產品中使用神經網絡技術,但沒有引起大的傳播。

究其原因。一位不具名的評論者告訴雷鋒網,之前很多人看到 Google 的電腦在圍棋上戰勝了人類,心理上受到了衝擊,自然而然認為  Google 強大的人工智慧技術,會顛覆很多行業。尤其是那些當初認為機器在圍棋上戰勝不了人類的人類,現在又對「人工智慧」過於樂觀了。

第十二步。

北京時間9月29日早上,論文作者之一,Google Brain 團隊的陳智峰,通過遠程視頻接受了 3 家中國媒體的採訪。他告訴雷鋒網,這次 Google 比較特別的地方在於,訓練過程利用了大量的分布式計算,所以才能把語言模型很快訓練出來。「差不多一星期處理一個方向的語言模型。但是 Google 有大概一萬個語言的模型需要訓練,既需要我們有巨大的資源投入,也在不停地改進算法。 」

對於機器翻譯取代人工翻譯的問題。陳智峰認為,規則的文本,比如醫學論文,比如時事新聞,大家更注重信息的傳達,在修辭方面或情感方面的傳達可以弱化一些。「機器翻譯就能夠很快地幫助你獲得信息,這是機器翻譯目前對人類的主要幫助。」

他說,「目前來講,我覺得人與人之間的自然的溝通,通過機器翻譯還是有很大的工作需要做。做到真正能夠讓你感覺到跟你說話的是個人,而不是機器,還是有很多年需要努力的。」 

// 參考來源

// 雷鋒網專題報導

雷鋒網原創文章,未經授權禁止轉載。詳情見轉載須知。

相關焦點

  • 谷歌機器翻譯取得顛覆性突破 到底幾分真假?
    最近,做機器翻譯的同志們一打開朋友圈,猛然發現好像飯碗沒了,谷歌爸爸大力出奇蹟,提高了機器翻譯87%的水平。結果打開人家原文一看,原來虛驚一場,只是現有工作的整合,一篇完美的工程論文,並沒有新的模型提出。不禁長舒一口氣,呼~飯碗還在。呼~到底火遍朋友圈的那篇文章「谷歌機器翻譯取得顛覆性突破,錯誤率下降87%」到底幾分真幾分假呢?
  • 谷歌發布神經機器翻譯,翻譯質量接近筆譯人員
    據外媒報導,谷歌於昨日發布了網頁版本和移動版本的谷歌翻譯。在漢譯英的過程中,谷歌翻譯會採用全新的神經機器翻譯機制,而這個App每天要進行一千八百萬次這樣的翻譯。此外,谷歌針對這個神經機器翻譯系統的運作原理,專門發表了一篇學術論文。
  • Google 翻譯「即時相機翻譯」功能更新升級
    PingWest品玩8月7日訊,根據微信公眾號谷歌黑板報消息,近日,Google 翻譯對「即時相機翻譯」功能在語種數量、自動檢測語言、翻譯準確率、界面友好度等方面都進行了進一步的更新升級。「即時相機翻譯」功能新增了60餘種支持語言,包括阿拉伯語、印地語、馬來語、泰語和越南語。
  • 英譯漢漢譯英全能王 必應詞典全文翻譯
    正因如此,翻譯這件事兒就成了一樁麻煩的事兒,雖然小趙的英語水平也不算太差,但是也經不住材料太多,翻譯起來總有力不從心的時候。  而在有較大翻譯量的情況下,必應詞典的劃譯功能更能夠節約大量的時間。劃譯的翻譯範圍非常明確,即被劃中的詞才會被翻譯。
  • 大明風華油管翻譯怎麼回事 中華文化博大精深
    大明風華油管翻譯怎麼回事 中華文化博大精深時間:2020-01-04 13:34   來源:海峽網綜合   責任編輯:凌君 川北在線核心提示:原標題:大明風華油管翻譯怎麼回事 中華文化博大精深 近期,由湯唯、朱亞文主演的《大明風華》正在湖南衛視熱播,在油管上也挺火的,因為油管上多為外國觀眾,因此《大明風華》就需要漢譯英了
  • 我想做一名英語翻譯,該如何入手?
    我找兼職英語翻譯的方法比較簡單粗暴——直接到翻譯公司去問他們是否招收兼職英語翻譯。翻譯公司問了我的專業後,給了我一份包裝機械的漢譯英的試譯稿,接過稿子我就懵圈了,一點思路都沒有,感覺英語白學了。那一刻我真的感覺到:英語好和會翻譯真的是兩碼事!
  • AlphaGo 神經網絡應用於 Google 翻譯,將接近人類水平
    Google 翻譯中,讓機器翻譯更加通順流暢,表意清晰。目前該系統僅應用於中文到英文的語言對翻譯。Google 表示,新的翻譯系統簡稱為 Google 神經機器翻譯(Google Neural Machine Translation-GNMT),就某些語言而言,GNMT 錯誤率可以減少 60%。
  • 翻譯漫談(十三) 漢譯英:替代
    關於漢譯英,我想談三個要點:1.替代(substitution);2.主謂(subject-predicate);3.主從(subordination)。這三個要點用英語表述,第一個字母都是S,因此可以簡稱「三S要點」。譯文質量不高,往往是因為這三個問題沒有處理好。換言之,若這三個問題處理得較好,可以為譯文增色不少。這一講,就集中談「替代」。
  • Google拍照即時翻譯功能大升級:可自動識別語言
    60種語言,還能自動識別語言並進行翻譯,同時加入神經機器翻譯技術以帶來更好的翻譯質量。首先,拍照即時翻譯新增超過60種語言,新加入的語言包括阿拉伯文、印度文、馬來文、泰文、越南文等,目前支持88種語言。過去用戶只能在英文和其他語言之間進行互譯,但現在可以將原文翻譯為Google翻譯支持的超過100多種語言。
  • 天氣預報是怎麼算出來的?
    大家每天都會看天氣預報,相信大家心中總會有這樣的疑問:天氣預報到底是怎麼做出來的呢?        其實它是計算機「算」出來的。天氣預報員先用計算機解出描述天氣演變的方程組,「算」出未來天氣;再通過分析天氣圖、氣象衛星資料等,結合積累的經驗,做出未來3天至5天的具體天氣預報。
  • 如何評價Google神經機器翻譯(GNMT)系統?
    其中,Google Translate的核心技術 「統計機器翻譯」其基本思想是通過對大量平行語料進行統計分析、構建統計翻譯模型、進而使用此模型進行翻譯。簡單來說,Google Translate 在生成譯文時,會在大量人工翻譯的文檔中查找各種模型,進行合理的猜測,從而得到恰當的翻譯。
  • 英語四六級改革後首開考 網友吐槽曬「神翻譯」
    試卷整段漢譯英,考生喊抓狂這次英語四六級考試一個最大的變化,就是將完形填空改為翻譯。改革後,將單句漢譯英調整為段落漢譯英,翻譯內容涉及中國歷史、文化、經濟、社會發展等各方面,四級長度為140~160個漢字,六級長度為180~200個漢字。
  • Google翻譯App更新:拍照就可翻譯!
    今天,Google翻譯App更新了!8年來,用戶可通過translate.google.cn訪問網頁版的Google翻譯,現在用戶還可下載Android和iOS版本應用。
  • 英語教學:日常的漢譯英中會出現哪些常見問題?
    無論是四六級考試還是平時做回譯練習,漢譯英都是必不可少的一個部分。對很多人來說,漢譯英要比英譯漢要難不少,這是因為漢譯英過程中我們更容易受中文遣詞造句習慣的影響,導致譯文不符合英語的用詞、語法和句法規範。具體來講,英語和漢語有以下幾個明顯的區別:漢語重意合,結構比較鬆散,因此短句比較多。
  • 科學家研發出「讀心術」,直接將腦電波翻譯成文本,錯誤率低至 3%
    美國加州大學舊金山分校的科學家,已經訓練出一種算法,可以直接將受試者的腦電波實時翻譯成句子,錯誤率僅為 3% 。這項研究發表在《自然神經科學》(Nature Neuroscience)雜誌上,他們招募了 4 位志願者,這些志願者被要求多次朗讀 30-50 個固定句子,而電極記錄下他們的大腦活動。
  • 原來英語四六級翻譯題這麼簡單!
    英語四級作為每年最容易得分、也最容易失分的題型一直是大家惡補的題型,翻譯題型在英語四六級考試中所佔分值為15%,為漢譯英,時長30分鐘。考試題型熱點題材多為歷史、經濟等內容。其中英語四級翻譯要求為半小時內將長度為140-160個漢字的段落翻譯成英語。
  • 那些年英語四六級考試中的「神翻譯」
    英語考試裡的神翻譯英語作為高考必考科目,已經成了不少家長和考生心中揮之不去的痛。但是,在英語考試中,也因此發生了不少趣事。因疫情影響,四六級一拖再拖,而在往年的四六級中,不乏一些考生「自曝家醜」,尤其是一些「神翻譯」笑料百出,簡直比搞笑段子還要有意思。
  • 技巧篇:「白洋澱」怎麼翻譯?山河湖海的翻譯方法 | CATTI和MTI
    技巧篇:「白洋澱」怎麼翻譯?今天今天高齋翻譯學堂雒老師Joy和小夥伴給大家總結了英語中常見的山河湖海名稱的翻譯方法,CATTI和MTI考試必備。1. 名稱是由單字+通名構成的,一般翻譯為雙字+通名。例如,「華山」翻譯為Huashan Mountain或者 Mount Hua;泰山Taishan Mountain或者Mount Tai;秦嶺 Qinling Mountains(這裡本處「秦嶺」是一個山脈,所以用複數)但這種翻譯也有特例,具體指的是一些約定俗成的翻譯,已經沿用了很久,例如,湘江the Xiang River;麓山 the Lu Mountains
  • 谷歌正式推出神經翻譯 翻譯水平遠超過去十年
    用谷歌翻譯常出錯,譬如......完全不懂怎麼會這樣,雖然我大天朝的文字遊戲的確複雜。 Google也一直在研究更準確的翻譯方式,最近Google正式啟用「神經網絡機器翻譯系統」。其最大特點在於,可以將句子視為一個整體進行翻譯,而非以往的將其拆分為詞和短語。同時,翻譯的精確度與流暢度也有所提升目前谷歌該系統支持八組語言的互譯,包括英語和法語、德語、西班牙語、葡萄牙語、中文、日語、韓語、土耳其語等。這包含了世界約三分之一人口的母語,佔到了谷歌翻譯查詢量的35%以上。
  • 2款免費的翻譯工具,無需註冊安裝3分鐘搞定
    這個問題在小穌童這裡,不建議存在的,別說你做全球,你能先把一個主流英文的國家先做好,小穌童就佩服你五體投地,你就是很牛批算大神了。做全球市場,你怎麼得精通八國語言吧,不然怎麼稱得上做全球。噢~當然,你可能請得起,懂得這麼多國家語言的業務,也行。完美關係有一個對話我特別有印象:邦尼會八國語言,竟然從沒出過國,說出來衛哲都不敢信。