機器翻譯裡程碑!谷歌上線Zero-Shot翻譯系統

2020-12-11 同花順財經

  騰訊科技訊 據外電報導,人工智慧技術在面對兩種語言同時轉換成第三種語言時,可以在保證合理正確率的情況下翻譯「語言對」( Language Pair )。這將大大減輕人工預先輸入學習的工作,使人工智慧技術在自學和解決問題方面有了長足的進展。

  「中介語言」(Interlingua)--人工智慧技術

  所謂神經網絡技術實際上就是讓機器和算法能夠儘量像人的大腦那樣思考和運算。谷歌翻譯的最新進展表明,人工智慧可以在許多方面超過人腦。谷歌人工智慧技術已經實現在沒有預先進行針對訓練的情況下翻譯語言對。換句話說,也就是可以不經學習就在不同語言間進行翻譯。尤其是在首次將事先未學習的兩種語言翻譯成一種已經學習過的語言時,人工智慧翻譯的效果更佳。美國康奈爾大學一份報紙對此進行了詳細的報導。

  谷歌近期將谷歌翻譯升級成谷歌深度學習神經機器翻譯系統(Google Neural Machine Translation ,GNMT),為通過人工智慧提升谷歌翻譯能力鋪平了道路。此前,Google Brain-谷歌翻譯研發團隊,研究出一種機器翻譯的自學方法,即所謂的「Zero-Shot翻譯」。

  該研究團隊致力於「深度學習」的研究項目,結合人工智慧技術,使谷歌翻譯可以在兩種事先未學習過的語言間轉換。簡而言之,該系統可以自動先將意思相近的句子或短語進行分組,然後通過預先學習過的語言將這些意思相近的句子有機聯繫在一起,這就是開發者所稱的「中介語言」的作用。

  「Zero-Shot翻譯」是指在完成語言A到語言B的翻譯訓練之後,語言A到語言C的翻譯不需要再經過任何學習。

  這項技術不但擴展了該軟體的使用範圍,還降低了高昂的計算成本。近10年來,谷歌翻譯從最初只能支持幾種語言的翻譯到目前支持103種語言,每天翻譯1400億個單詞。為支持不同語言翻譯過程中寵大的運算量,谷歌必須維持許多不同的運算系統,在運算上投入了巨大的成本。

  谷歌對原翻譯系統進行了再開發,從三維模型圖示可以看出,該GNMT系統所採用語義理解模式要比傳統的短語對短語的翻譯模式要複雜的多。GNMT的優點在於系統運行基礎並沒有大的變化,只是在開始的語言輸入過程中通過表徵符號來確定目標語言然後進行翻譯,從而在單一系統上完成了多語言間的轉換,大大減少了系統翻譯運行的計算量。

  谷歌深度學習神經機器翻譯系統在許多方面進行了革新,通過開發模型可以省略人工輸入學習語言的過程,使得翻譯質量有了顯著提高,這些都得益於先進的綜合解碼系統的發展。GNMT提高翻譯質量的同時,還使谷歌翻譯產品架構大為簡化。目前,谷歌翻譯用戶已經可以在GNMT系統下進行翻譯,新系統翻譯的語言也更加流暢自然。

  人工智慧的未來

  未來,開發出完全不需要人類語言提示的人工智慧翻譯技術是有可能的。這即是好消息,也是壞消息。

  研究人員正在開發人工智慧的自學能力,也許不久的將來人們都可以用上具備自學能力(能夠通過自身運行經驗提升性能)的電腦。也就是說,屆時,電腦不僅可以進行自我訓練提高,還可以在沒有提示的前提下分析人們的需求和預測人們的想法。

  當然,上述設想與人工智慧現在的發展水平還有一定的距離。不過隨著技術的一天天進步,人工智慧不僅會達到人腦的水平,未來很可能在很多方面超過人腦。因此,一些人對未來完全自主化的人工智慧技術可能會擾亂社會的擔憂也不是在杞人憂天。

  科技的發展告訴我們,在創造機器並用它來解碼複雜的網絡計算的同時,我們需要確定如何才能最佳的利用人工智慧技術。今天,人工智慧只是在在線翻譯上小試牛刀,其未來應用領域將是非常廣闊的。(編譯/青松)

關注同花順財經(ths518),獲取更多機會

責任編輯:lwy

相關焦點

  • 谷歌翻譯裡程碑:基於單一模型的 Zero-Shot 系統正式上線
    為了做到這一點,在任意兩種語言之間,谷歌翻譯都要運行多個翻譯系統,這帶來巨大的計算成本。如今,許多領域都正在被神經網絡技術顛覆。谷歌確信他們可以利用神經網絡進一步提升翻譯質量。這要求谷歌重新思考谷歌翻譯的算法架構。今年九月,谷歌發表聲明,基於神經機器翻譯的谷歌翻譯全新上線。(GNMT,Google Neural Machine Translation)。
  • ...谷歌神經機器翻譯再突破:實現高質量多語言翻譯和zero-shot翻譯
    》,介紹了谷歌的神經機器翻譯系統(GNMT),該系統實現了機器翻譯領域的重大突破,參見報導《重磅 | 谷歌翻譯整合神經網絡:機器翻譯實現顛覆性突破》。昨日,谷歌再發論文宣布了其在多語言機器翻譯上的突破:實現了 zero-shot 翻譯!昨天,谷歌在其官方博客上宣布其在谷歌翻譯(Google Translate)上再次取得重大進展。
  • 【重磅】谷歌發布 Zero-Shot 神經機器翻譯系統:AI 巴別塔有望成真
    我們將其稱為「零數據」(zero-shot)翻譯,如動畫中的黃色虛線所示。據我們所知,這還是首次將這種類型的遷移學習應用機器翻譯中。零數據翻譯的成功帶來了另一個重要的問題:系統是否學會了一種通用的表徵,其中不同語言中具有相同意義的句子都以類似的方式表示,也即所謂的「國際通用語」(interlingua)?
  • 谷歌翻譯裡程碑:工智能神經網絡翻譯支持103種語言,翻譯字詞超過...
    谷歌確信他們可以利用神經網絡進一步提升翻譯質量。這要求谷歌重新思考谷歌翻譯的算法架構。  今年九月,谷歌發表聲明,基於神經機器翻譯的谷歌翻譯全新上線。(GNMT,Google Neural Machine Translation)。神經機器翻譯是端到端的學習架構,它能從數百萬的實例中學習,提供大幅提升的翻譯效果。
  • 谷歌推出Zero-Shot翻譯技術 解決一對多難題
    谷歌翻譯的語言種類數量已經上升到了103種,現在它平均每天要翻譯超過1400億個詞。
  • 谷歌發布神經機器翻譯:翻譯質量接近筆譯人員
    據外媒報導,谷歌於昨日發布了網頁版和移動版的谷歌翻譯。在漢譯英的過程中,會採用全新的神經機器翻譯,而這個App每天要進行一千八百萬次這樣的翻譯。此外,谷歌針對這個翻譯系統的運作原理,發表了一篇學術論文。早前,谷歌就曾表示它們在谷歌翻譯中運用了神經網絡技術,但只限於實時視覺翻譯這個功能。
  • 谷歌發布神經機器翻譯,翻譯質量接近筆譯人員
    據外媒報導,谷歌於昨日發布了網頁版本和移動版本的谷歌翻譯。在漢譯英的過程中,谷歌翻譯會採用全新的神經機器翻譯機制,而這個App每天要進行一千八百萬次這樣的翻譯。此此外,谷歌針對這個神經機器翻譯系統的運作原理,專門發表了一篇學術論文。早前,谷歌就曾表示過,他們在谷歌翻譯中運用了神經網絡技術,但只限於實時視覺翻譯這個功能。前段時間,谷歌一名叫Jeff Dean的高級員工曾經告訴VentureBeat,谷歌已經在嘗試把越來越多的深度學習功能和機制融入到谷歌翻譯中。
  • 谷歌的神經翻譯系統意味著機器翻譯到盡頭了?
    整個的報告以機器翻譯為主線展開,大概分四部分:第一叫做機器翻譯的波瀾史,幾十年的發展一波三折,非常有意思;第二是機器翻譯現在主流的技術神經機器翻譯,還是可以改進的。我可以給大家看一些例子,並不是谷歌就做到頭了,還有很多的空間。
  • 谷歌用神經機器系統把漢語翻譯成英語 錯誤率最高下降85%
    新浪科技訊 北京時間9月28日上午消息,谷歌今天宣布,網絡和移動版的谷歌翻譯現在使用新的神經機器翻譯系統,並用於漢譯英,目前,谷歌翻譯應用每天翻譯約1800萬次。谷歌也在發布一篇關於該方法的學術論文。 此前谷歌也曾表示在谷歌翻譯中使用神經網絡,但具體用於實時視頻翻譯功能。
  • 谷歌的神經翻譯系統並不意味著機器翻譯到頭了,還有大把創新可做|...
    整個的報告以機器翻譯為主線展開,大概分四部分:第一叫做機器翻譯的波瀾史,幾十年的發展一波三折,非常有意思;第二是機器翻譯現在主流的技術神經機器翻譯,還是可以改進的。我可以給大家看一些例子,並不是谷歌就做到頭了,還有很多的空間。
  • Facebook提出全新CNN機器翻譯:準確度超越谷歌而且還快九倍(已開源)
    去年穀歌在機器翻譯上取得了連續不斷的突破,參閱《重磅 | 谷歌翻譯整合神經網絡:機器翻譯實現顛覆性突破》和《重磅 | 谷歌神經機器翻譯再突破:實現高質量多語言翻譯和 zero-shot 翻譯》。谷歌的方法用到了文本處理慣用的循環神經網絡。近日,Facebook 也宣布在神經機器翻譯上取得了重大進展,在超過了去年穀歌研究的水平的同時還實現了顯著的速度提升。
  • 谷歌神經機器翻譯之我見
    本文寫於2016年9月Google升級神經機器翻譯(GNMT)之際。
  • 谷歌推神經網絡翻譯 中譯英水平匹敵真人
    據澎湃新聞9月29日報導,27日,谷歌推出了新的翻譯系統,聲稱該套翻譯系統基於對人類神經思考的模仿,能夠與真人翻譯競相匹敵。在谷歌發表的題為《規模生產中的神經網絡機器翻譯》(A Neural Network for Machine Translation, at Production Scale)的文章中,宣布將機器學習技術納入網頁和手機APP翻譯中,從前漢譯英的尷尬局面將大為扭轉。
  • 谷歌翻譯啟用全新神經網絡機器翻譯支持印地語、俄國和越南語
    《谷歌翻譯啟用全新神經網絡機器翻譯支持印地語、俄國和越南語》文章已經歸檔,不再展示相關內容,編輯建議你查看最新於此相關的內容:牽手Google,王雪紅意欲成就HTC再次起飛HTC與Google籤署戰略合作協議的消息傳出後
  • 人工智慧技術讓谷歌機器翻譯水平遠超過去十年
    DoNews 11月18日消息(編輯 趙晉傑)近日,谷歌宣布Google翻譯正式啟用神經網絡機器翻譯系統。其最大特點在於,可以將句子視為一個整體進行翻譯,而非以往的將其拆分為詞和短語。同時,翻譯的精確度與流暢度也有所提升。
  • 谷歌推出神經網絡翻譯 中譯英水平匹敵真人?
    輸入中文,翻譯系統給出的答案往往是「慘不忍睹」,簡單的機械翻譯對於那些谷歌翻譯的依賴者來說已遠遠不夠。谷歌公司稱,相較之前的算法,谷歌神經機器翻譯能減少80%的錯誤,與通過標準測試的真人翻譯所差無幾。  在之前的一項西班牙語譯為英語的測試中,設定滿分為6分,谷歌舊的翻譯系統得到3.6分,人類普遍得分為5.1分,而谷歌的新系統得到了5分的好成績。
  • 谷歌翻譯高勤:神經網絡技術將主導機器翻譯的未來
    谷歌翻譯研發科學家高勤  中國網科技7月11日訊 谷歌翻譯研發科學家高勤在今天舉行的中國網際網路大會上介紹稱,谷歌翻譯在神經網絡機器翻譯技術上已經取得重要進展,並同時對機器翻譯技術在未來當中實際應用。他表示:「神經網絡機器翻譯和非專業人工翻譯已經相當接近,對於中英文互譯也取得最大提升。」  高勤在大會上稱,神經網絡翻譯技術與傳統翻譯技術有很大不同。傳統機器翻譯技術是基於短語統計機器翻譯拼圖過程,嘗試找出較好翻譯選項,而神經網絡機器學習屬於利用雲語言與目標語言信息,使整各翻譯過程變得連續且完整。
  • AI 裡程碑!機器翻譯系統提前7年達到人類專業翻譯水平
    裡程碑式突破:首個媲美人類專業水平的機器翻譯系統   這次微軟的翻譯系統是在數據集 WMT-17 的新聞數據集 newstest2017 上取得了上述成果。WMT 是機器翻譯領域的國際頂級評測比賽之一。WMT 數據集也是機器翻譯領域一個公認的主流數據集。
  • 谷歌機器翻譯取得顛覆性突破 到底幾分真假?
    最近,做機器翻譯的同志們一打開朋友圈,猛然發現好像飯碗沒了,谷歌爸爸大力出奇蹟,提高了機器翻譯87%的水平。結果打開人家原文一看,原來虛驚一場,只是現有工作的整合,一篇完美的工程論文,並沒有新的模型提出。不禁長舒一口氣,呼~飯碗還在。呼~到底火遍朋友圈的那篇文章「谷歌機器翻譯取得顛覆性突破,錯誤率下降87%」到底幾分真幾分假呢?
  • 翻譯界的重大突破——谷歌翻譯整合神經網絡,翻譯質量接近人工筆譯...
    System: Bridging the Gap between Human and Machine Translation》介紹谷歌的神經機器翻譯系統(GNMT),當日機器之心就對該論文進行了摘要翻譯並推薦到網站(www.jiqizhixin.com)上。