那些說谷歌翻譯讓專業翻譯丟飯碗的人,肯定沒用過

2020-12-01 IT之家

請各位親愛的讀者朋友記得,所有沒有給出時間期限的科技預測那都是在耍流氓。

當一款新的技術,不,應該說當一個技術出現了一丁點欣喜的進步時,現在科技圈裡就立刻往它的身上貼上各種「顛覆」的標籤。

如果你是一位科技新聞的讀者,想必已經對「顛覆」這個字眼感到些許的麻木甚至噁心了吧?那天翻地覆的變化似乎就要出現在明天。

科技媒體善於吸引人們目光,這固然是從業人員的一種必備本領,但如今所有人都左顧右盼,像是熱鍋上的螞蟻一樣焦躁不安,這真的是正常現象嗎?科技媒體眼中。科技創新把世界世界攪的天翻地覆。沒事兒三天一創新,五天一顛覆,未來我們在這個世界站穩腳跟的著力點又是在哪裡呢?

在這其中,尤其是以圍繞著「人工智慧」的呼聲最為洶湧澎湃。前不久,Google推出了基於神經網絡而開發的全新的Google Translate,引起業界的一片驚呼。不少人甚至都建議國家完全沒有必要在開設外語專業了,翻譯就此在機器學習的帶動下徹底消失了!

然而事實上,如果我們站的遠一些去看它,如果還模糊不清就再在額頭上貼個冰塊兒,你就會發現任何有關「機器將取代人工翻譯」的言論都是無稽之談。今天,五十度矽會好好地跟大家掰扯掰扯為什麼機器代替不了人工的翻譯,並由此我們可以稍微聊一聊人與機器究竟應該保持這樣的一種關係。

Google的神經網絡翻譯究竟是怎麼一回事?

事實上,十年之前網絡上就已經提供在線翻譯服務了,而其實在很早以前,關於「機器即將替代人類進行翻譯」的論調就不絕於耳。而之所以如今大家的目光再次回到這上面,完全是因為Google將自己的在線翻譯服務進行了升級換代,推出了一款名為基於「神經網絡」的機器翻譯系統。

咱們先說說什麼是「神經網絡」?

自打有了計算機以來,努力讓機器智能逐漸向人類大腦過渡成為了很多科研人員的一個夢想。但直到如今,在這方面的進展幾乎可以用紋絲不動來形容。人們都清楚,機器和人類的側重點不一樣。在機器眼中不費吹灰之力的運算,邏輯判斷,這在人類來看是需要大量腦力才能完成的事,而對於人類來說,那些輕而易舉就能辦到的事,比如辨識物體,人們的身份,自由流暢的語言溝通,迅速地學習並適應某一種方言,這些對於機器來說簡直是不可能完成的任務。

在好幾次向「人腦」發起衝鋒未果之後,研究人員提出設想,為什麼我們不搭建一個類似於人腦一樣的神經網絡呢?讓計算機運算單位之間的關係搭建,就完全按照人腦來設計。雖然,

人類至今尚未明白人腦的工作原理,不過這沒關係,我們可以先複製出一個人腦的計算模型:一件事情並非像電腦程式那樣輸入指令輸出結果,而是在人腦的多個神經元傳遞,每個神經元都對信息進行自己的加工,最後輸出的結果。計算機科學家用同樣的方式,在輸入和輸出之間,加入了非常多的「節點」,每個節點會對前一個節點傳來的數據,按照自己擁有的一個權重係數進行加工,有時候節點還會分層。這就是「人工神經網絡」(Artificial Neural Networks,ANN)。

那麼,Google搞得這次基於神經網絡的機器翻譯系統又是怎麼一回事呢?

之前我們經常用到的翻譯服務,其實是基於「詞組」來進行的。也就是說,一段文字出現之後,系統會直接把這段文字給拆散了,最小單位就是「詞組」,然後將每個詞組找到相對應的翻譯版本,再進行次序的調整,最後出來一篇譯文。這是一個有著明確的先後次序的翻譯工作,即:打散、找對應的詞組、排序、其中包括了標點符號的重新分割,整理等多個環節。

按道理來說它其實不怎麼容易出錯,但是每一個環節雖然準確率還蠻高,但是架不住環節多啊,一旦有一個地方出現了偏差,後面就如倒掉的積木一樣全部都散了架了,最後出來的翻譯內容當然不忍猝讀。

而基於神經網絡的翻譯系統,直接跳過了這麼多繁瑣的步驟,它直接直接依靠「海量數據」來獲勝,也就是說它直接建立起來了兩個對應著的平行語言庫,然後讓機器自己去學習如何進行對應。這樣的法子其實很早就出現了,但是它也有一定的技術難題沒有攻破,比如說機器學習起來速度實在非常慢,而且稍微碰上一些沒怎麼見過的話,它就不知道該怎麼辦了,但是Google這次通過技術創新,讓它無論在翻譯的準確性和速度上都獲得了大大的提升。

由此,翻譯再也不是簡單的詞與詞,詞組與詞組的對應,而是能夠從一段文章的角度去把握全文,這樣出來的譯文更加流暢自然。

那麼,這是不是就意味著人類翻譯在此下崗了呢?

既然我們現在知道了Google翻譯在此取得的重大進展,那麼現在是時候把機器和人類放在翻譯的天平上稱稱斤兩,比較一下孰輕孰重了!

首先第一點:翻譯是一件非常困難的工作,有些翻譯甚至是極具翻譯才華的人都無法勝任。

機器之所以無法取代專業譯員,其實道理很簡單:現在在國外生活,能夠自由使用兩國語言的人那麼多,但並不意味著他們就能提供專業的翻譯服務。

對於很多翻譯工作來說,翻譯所要求的並不僅僅是你需要熟悉兩國國家的語言文字。很多人覺得翻譯無非就是將兩種語言字對字,詞對詞,句對句的對應起來,其實並非如此。譯員也不是一本會行走的「活字典」。

更準確的說,他們是兩種文化之間的橋梁,在他們大腦對信息的消化、加工、過濾之後,語言不僅僅是從形式上變得熟悉,而在文化上面也儘可能地貼近。有些時候,他們甚至會發明創造一些說法,使得人們更容易接受,有些譯員有可能傾其一生,將在兩個不同的國家的生活經驗灌注到翻譯工作中,使得兩種文化能夠更好的交融。而機器,是無法做到這一些的。

2、翻譯質量沒有單一標準。

就算是機器通過了上面這一道關卡的考驗,能夠輕鬆承擔起各項翻譯工作,但是它的翻譯質量是否有一個標準進行衡量呢?顯然是沒有的。你將一段文本交給100個人類譯員,他們會給你一百種不同的版本,哪種翻譯質量高?哪種低?有的也許在行文造句上極為優美流暢,有的則是在邏輯論證上面十分的嚴謹正式,在面對不同的對象,不同的環境時,考量的標準是不一樣的。而人與人之間的交流效果,是無法通過機器來實現單一標準劃定的。

它並不是一場象棋比賽,擁有非常客觀的邏輯推理。之所以有多個翻譯版本,影響因素除了語法上的考量,還有語言深意的側重點,哪怕是同樣一句話,在不同的人那裡讀起來,因為語調、語氣等原因,也會呈現微妙的區別。

3、世界上的語言種類太多了,遠超過你的想像。

現在的Google Translat支持翻譯80種語言,但是如今在我們的世界上,還存在著6000到7000種語言,其中2000種雖然瀕臨滅絕,但我們就算是拿保守估計來算,這其中有1000種語言在經濟層面具有重要影響力,那麼Google即還得去徵服920種語言,就算是每年Google的翻譯能力擴張10種語言,那麼92年之後,Google翻譯才算是勉強覆蓋了人類的語言圖譜。

4、語境是關鍵。

就拿英語來舉例子好了,幾乎沒人知道,一個單一的詞彙會有幾百種的意思,這完全取決於當時說話的語境是什麼。事實上,牛津英語詞典中光是「Run」這一個單詞,就至少有645種不同的意思。一臺電腦真的不僅僅能在一種語言中識別這麼多的意思,而且還能在兩種語言中找到一一對應關係嗎?

換句話說,詞與詞對應的翻譯是不現實的,真正的翻譯不是從「字詞」去著眼,而是將「語境」和「意義」兩者結合起來。而這兩者結合起來的方式還在不斷地發生著變化,這種變化背後的動因,則是來源於人們大腦無限的創意。機器,在短時間內是無法跟得上這個步伐的。

5、商業開發領域,語言真的是太重要了,其重要程度決定了翻譯必須依賴於人類。

你的公司在描述你的產品和服務的時候,你知道你所採用的語言扮演多麼重要的角色嗎?顧客們在做購買決策的時候,與這些話之間會產生千絲萬縷的聯繫。在商業宣傳的翻譯領域,機器是否能夠達到俘獲人心的作用呢?

一家大公司在施展自己的全球化戰略時,勢必要進行很多本土化的營銷工作,這些翻譯工作必須依賴於人來完成,因為只有人,才能說出貼合人心的話。(這個判斷至少在我們有生之年是成立的。)

所以,鑑於以上的幾點原因,機器翻譯在短時間內是不會顛覆翻譯這個領域,那麼為什麼每次科技界有一點點的動靜,全世界的人都在慶賀,好像明天翻譯就被機器取代了似的?

最後的話

請各位親愛的讀者朋友記得,所有沒有給出時間期限的科技預測那都是在耍流氓。在沒有時間框架的制約下,科技小編們的想像力就像是蝴蝶一樣紛飛,這樣的場景固然美麗,但是蝴蝶所到之處灑下來的,卻是不必要的恐慌和焦慮。

「顛覆」和「取代」,這樣的詞內含著一種非此即彼,簡單粗暴的邏輯,它描繪起來快速省事兒,直接刺激大腦皮層的快感;但是現實往往是影響,融合,改變,這樣的過程複雜且充滿變數,而我們所面對的世界往往總是如此,人與機器如何能夠更好的協作分工,這才是每個人應該思考的問題以及努力的方向。

最後,還是說回到我們這片文章的主題:機器是否能夠替代人工翻譯?其實「不能替代」的核心原因只有一個:文化與文化相互之間的學習,融合,只有通過「人」這個媒介才能完成。機器只是翻譯領域一個更加趁手的工具而已。正如電子商務的出現無法替代人工銷售。哪怕是持有同樣一種語言的人,銷售有時候還是憑藉人本身才能完成的。

相關焦點

  • 谷歌機器翻譯取得顛覆性突破 到底幾分真假?
    最近,做機器翻譯的同志們一打開朋友圈,猛然發現好像飯碗沒了,谷歌爸爸大力出奇蹟,提高了機器翻譯87%的水平。結果打開人家原文一看,原來虛驚一場,只是現有工作的整合,一篇完美的工程論文,並沒有新的模型提出。不禁長舒一口氣,呼~飯碗還在。呼~到底火遍朋友圈的那篇文章「谷歌機器翻譯取得顛覆性突破,錯誤率下降87%」到底幾分真幾分假呢?
  • 翻譯軟體成出境遊「神器」?
    筆者體驗比對後發現,對外語很差的人來說,翻譯軟體確實是出境遊的好幫手,但只能應對簡單的短句翻譯,準確性不高,複雜交流完全無法勝任。因此,想靠小小翻譯軟體走天下的人,美夢還難以成真。  出境遊火,翻譯軟體受追捧  「天啊,沒想到連我學的那麼稀有的語種都有!」剛剛下載了谷歌翻譯的泰米爾語專業畢業生張琪頗為驚訝。
  • 谷歌翻譯怎麼使用 谷歌翻譯在中國可以用嗎
    谷歌翻譯怎麼用?   1、以安卓版為例:下載谷歌翻譯app並安裝即可。  2、安裝完成後,打開Google Translate實時翻譯;先選擇【 語言 】如下圖所示。  首屏中可以看到有文字實時翻譯、拍照翻譯、語音實時翻譯、手寫塗鴉翻譯等等、  比如文字翻譯;只需在白色空白處,輸入想要翻譯的漢字、字句,而藍色部分就是實時翻譯得到的英文結果。同時你也可以點擊【 小喇叭 】試聽發音語言。
  • 四大軟體翻譯古詩,谷歌亂了,百度最準,有道翻譯亮了
    目前機器智能翻譯非常方便,但是畢竟比不上人工理解的語境,所以會出現很多的錯漏,往往只能作為翻譯參考輔助。中譯英,最難的應該是古詩文的翻譯,直譯肯定是百分百不行的,意譯也要講究語境和感情是否到位。今天老師用了一句經典的古詩「多情自古空餘恨」來測試了一下市面上的機器翻譯,來看看他們的實力如何吧!
  • 硬核測評,谷歌翻譯被碾壓!全球首個翻譯引擎進化歸來,「細節狂魔...
    這款翻譯軟體名叫DeepL,大火的原因正是因為它工作太負責了,翻譯得太過準確,在日本引起了熱議。,DeepL官方也公開了日英互譯和中英互譯的盲測結果,如下圖所示,可以看出,DeepL簡直就是碾壓級的存在嘛:盲測就是在專業譯員評審們不知道哪個翻譯版本是由哪個網站翻譯的情況下
  • 谷歌發布神經機器翻譯,翻譯質量接近筆譯人員
    據外媒報導,谷歌於昨日發布了網頁版本和移動版本的谷歌翻譯。在漢譯英的過程中,谷歌翻譯會採用全新的神經機器翻譯機制,而這個App每天要進行一千八百萬次這樣的翻譯。此外,谷歌針對這個神經機器翻譯系統的運作原理,專門發表了一篇學術論文。
  • 八大翻譯軟體大揭秘,告訴你科研翻譯的正確打開方式
    無論是閱讀文獻還是SCI的寫作,翻譯軟體都是我們必不可少的一部分。可以說,不管是科研新手還是久經沙場的科研大神,我們都需要翻譯軟體的輔助。說到翻譯軟體,很多讀者的第一印象,肯定是谷歌翻譯,百度翻譯。其實,還有很多隱藏的優秀翻譯軟體,效率更高,甚至都有各自獨特的使用方式。到底哪個翻譯引擎的翻譯效果更好,哪個翻譯引擎的效率更高呢?
  • 四大離線詞典大比拼之專業詞翻譯
    【IT168 軟體評測】對於具備一定英語閱讀基礎的用戶來說,常用單詞大多已掌握,因此需要通過詞典翻譯的多為那些比較專業的詞彙。但專業性的詞彙可能就有些生僻,這就要求詞典的專業詞庫夠強悍或是具備擴展能力。那麼,國內最具用戶口碑的四款詞典軟體能否成為專業詞翻譯的超級魔法寶典呢?
  • 人工智慧會取代人工翻譯嗎
    法國科學家蘇埃爾說:「機器高度擬人化,將重新定義『人』的價值。」自1956年DARTMOUTH學會上首次提出人工智慧的概念,到如今物聯網、大數據、阿爾法狗戰勝柯潔、雲計算……人工智慧發展得如火如荼,成為21世紀新的風口,影響著千千萬萬的行業。
  • 重磅| 谷歌大腦養成記:從識別貓到突破性機器翻譯
    貓識別論文在最初的一兩年,谷歌大腦設計出了具有 1 歲孩童智力的機器,這些努力讓其最終從 X 實驗室畢業,進入了公司更寬闊的研究中。(谷歌 X 負責人曾提到谷歌大腦曾支付過 X 的所有花費)。而那時的谷歌大腦團隊依然不足 10 人,也不清楚最後會得到什麼。但即使如此,他們仍在思考接下來會發生什麼。人的思想不需要多少時間就能學會識別球和其它東西,時間或長或短。然後,開始進軍語言。
  • BAT、谷歌、Facebook都在搞的神經機器翻譯,真的就地表最強了嗎?
    2014年到2016年,機器翻譯領域可以說是翻天覆地。時過一年,市面上的NWT系統越來越多,國內的BAT、搜狗,國外的谷歌、Facebook、微軟等都在布局。雖然翻譯質量確有提高,但遠沒到上述引文中描繪的發生「質變」的程度。這到底是為什麼?於是,我們選取了目前最有代表性的谷歌GNWT和屢獲大獎的搜狗的SogouNWT,來摸索一下今天神經網絡機器翻譯的真實水平和進化空間。
  • 谷歌翻譯是如何藉助多項新興AI技術提高翻譯質量的
    據國外媒體報導,谷歌表示,它已在提高沒有大量書面文本語料的語言的翻譯質量上取得了進展。在一篇即將正式發表的博客文章中,該公司詳細介紹了助力提升谷歌翻譯(Google Translate)所支持的108種語言翻譯質量的新創新技術(特別是缺乏語料數據的約魯巴語和馬拉雅拉姆語)。谷歌翻譯服務平均每天翻譯1500億個單詞。
  • 我的世界:谷歌翻譯是一個「渣渣」?MC玩家:這輩子再也不會用
    但是經過谷歌翻譯之後,它這個功能性的物品卻翻譯成了另外一個讓人匪夷所思的內容。芬達有劇毒,按我的理解是我的世界經過谷歌翻譯之後,已經讓谷歌翻譯神經錯了。芬達是屬於一種飲料,如果說芬達有毒的話,誰還會去喝芬達呢。
  • 谷歌推出拉丁語翻譯服務
    新浪科技訊 北京時間10月1日消息,據國外媒體報導,谷歌表示,已經將拉丁文加入其翻譯服務中。這是谷歌支持的第58種語言,也是第一種已經不使用了的語言。「我們很興奮的宣布,我們首次為一個已經沒有人作為母語使用的語言推出翻譯系統。」這家搜索與網絡廣告巨頭在聲明中說。
  • 必應翻譯被拋棄:Twitter PWA轉用谷歌翻譯
    IT之家3月22日消息 此前,許多公司都使用必應搜索作為其搜索解決方案,如蘋果、Facebook以及Twitter等,這些公司並沒有使用谷歌搜索。不過,情況正在發生變化。去年,蘋果開始轉用谷歌搜索,放棄微軟的必應。
  • 「苟富貴勿相忘」翻譯後,谷歌:沒錢的人總會被遺忘
    最近,B站上一位叫做「鷹目大人」的阿婆主就用谷歌翻譯對AI進行了一次隨堂測驗,只不過它的表現嘛,就見仁見智了。 比如,AI就把這句著名的「苟富貴,勿相忘」就翻譯成了「沒有錢的人,總是會被遺忘」。 「燕雀焉知鴻鵠之志」在AI看來竟然是,「蠍子給了我一個熱烈的擁抱」???
  • 谷歌正式推出神經翻譯 翻譯水平遠超過去十年
    用谷歌翻譯常出錯,譬如......完全不懂怎麼會這樣,雖然我大天朝的文字遊戲的確複雜。 谷歌的工程師面臨很大的麻煩,畢竟它需要覆蓋100中語言,相互間排列組合能達到上萬種。Google也一直在研究更準確的翻譯方式,最近Google正式啟用「神經網絡機器翻譯系統」。
  • 谷歌翻譯iOS版更新 增加鏡像/拍照翻譯模式
    【巴士數碼】1月15日訊:近日,谷歌翻譯iOS版更新了3.1.0版本,本次更新前該應用只有手寫、鍵盤和語音輸入翻譯,和「百度翻譯」等其他主流翻譯應用相比稍顯單薄,不過更新之後,它終於變得更強悍了。
  • 重磅| 谷歌神經機器翻譯再突破:實現高質量多語言翻譯和zero-shot...
    》,介紹了谷歌的神經機器翻譯系統(GNMT),該系統實現了機器翻譯領域的重大突破,參見報導《重磅 | 谷歌翻譯整合神經網絡:機器翻譯實現顛覆性突破》。Google Translate 產品負責人 Barak Turovsky 在谷歌舊金山的一次新聞發布會上說:「這一次的進步超過了過去十年積累的總和。」谷歌已經將自己的未來定義成了一家人工智慧和機器學習公司——使用這些技術的計算機無需特定的編程就能自己學習執行任務。
  • B站「不靠譜」翻譯大賽:機器翻譯,還遠不能取代人工翻譯
    在國內知名的彈幕視頻網站bilibili上,很多up主上傳了令人啼笑皆非的機器翻譯視頻。 網友們把一些影視劇、動漫或者其他著名場面中的臺詞用谷歌翻譯重新加工。如果只是翻譯一遍的話,可能效果還不理想——它們錯得還不夠精彩。於是,網友們把谷歌翻譯的結果再翻譯成第三種語言,然後再翻譯成第四種語言,最後再用谷歌翻譯回中文。