Facebook宣布全面轉為神經網絡人工智慧翻譯

2020-12-13 雷鋒網

雷鋒網 AI 科技評論按:語言翻譯是一股能夠讓人們組建群體和使世界更加緊密的力量。 它可以幫助人們與在海外居住的家庭成員聯繫起來,或者可以更好地了解講不同語言的人們的觀點。 通過使用機器翻譯,自動翻譯文章和評論,以打破語言障礙,使得世界各地的人們可以相互溝通。

即便體量大如 Facebook,想要為20億使用的用戶創造無縫、高精確的翻譯體驗也是很困難的,這需要同時考慮上下文、俚語、打字錯誤、縮寫和語意。 為了繼續提高翻譯質量,Facebook團隊最近宣布從基於短語的機器翻譯模型切換到基於神經網絡的翻譯模型,來支持所有的後端翻譯系統。每個翻譯系統每天翻譯超過2000個翻譯方向和45億個翻譯。 這些新模型能夠提供更準確和更流暢的翻譯體驗,改善了人們在使用Facebook時,閱讀由非常用語言撰寫的內容時的閱讀體驗。雷鋒網 AI 科技評論根據 Facebook 文章對相關情況編譯介紹如下。

使用上下文

Facebook以前使用的基於短語的統計技術確實有效,但它們也有局限性。基於短語的翻譯系統的一個主要缺點是它們將句子分解成單個單詞或短語,因此在生成翻譯時,他們每次只能考慮幾個單詞。 這種方法導致當翻譯具有明顯不同字詞排序的語言時會出現翻譯困難的情況。為了彌補這個問題並構建神經網絡系統,Facebook開始使用一種被稱為序列到序列LSTM(long short-term memory)的循環神經網絡。 這種網絡可以考慮源語句的整個上下文以及到目前為止生成的一切內容,以創建更準確和流暢的翻譯。 這樣當遇到例如在英語和土耳其語之間翻譯字詞排列不同時,可以重新排序。 當採用基於短語的翻譯模型從土耳其語翻譯到英語時,獲得以下翻譯:

與基於神經網絡的從土耳其語到英語的翻譯相比較:

當使用新系統時,與基於短語的系統相比,BLEU平均相對增長了11% - BLEU是廣泛使用的用於判斷所有語言的機器翻譯準確性的度量標準。

處理未知詞

在許多情況下,源語句中的單詞在目標詞彙表中並沒有直接對應的翻譯。 當發生這種情況時,神經系統將為未知詞生成佔位符。 在這種情況下,可以利用注意機制在源詞和目標詞之間產生的軟校準,以便將原始的源詞傳遞到目標句子。 然後,從培訓數據中構建的雙語詞典中查找該詞的翻譯,並替換目標語句中的未知詞。 這種方法比使用傳統字典更加強大,特別是對於嘈雜的輸入。 例如,在從英語到西班牙語的翻譯中,可以將「tmrw」(明天)翻譯成「mañana」。雖然增加了一個詞典,BLEU得分只有小幅的改善,但是對於使用Facebook的人而言評分更高了。

詞彙量減少

典型的神經機器翻譯模型會計算目標詞彙中所有單詞的概率分布。 在這個分布中包含的字數越多,計算所用的時間越多。 通過使用一種稱為詞彙減少的建模技術,可以在訓練和推理時間上彌補這個問題。 通過詞彙減少,可以將目標詞彙中最常出現的單詞與給定句子的單個單詞的一組翻譯候選相結合,以減少目標詞彙的大小。 過濾目標詞彙會減少輸出投影層的大小,這有助於更快的計算,而且不會使過大的降低質量。

調整模型參數

神經網絡幾乎通常具有可調參數,可以通過這些參數調節和控制模型的學習速度。 選擇超參數的最佳集合對於性能是非常有幫助的。 然而,這對於大規模的機器翻譯提出了重大的挑戰,因為每個翻譯方向是由其自己的一組超參數的唯一模型表示。 由於每個模型的最優值可能不同,因此必須分別對每個系統進行調整。 Facebook團隊在數月內進行了數千次端對端翻譯實驗,利用FBLearner Flow平臺對超參數進行微調,如學習率,注意力類型和總體大小。 這些超參數對一些系統有重大影響。 例如,僅基於調優模型超參數,就可以看到從英語到西班牙語系統的BLEU相對值提高了3.7%。

用Caffe2縮放神經機器翻譯

過渡到神經系統的挑戰之一是讓模型以Facebook上的信息規模所需的速度和效率運行。 因此Facebook團隊在深入學習框架Caffe2中實現了翻譯系統。 由於它的靈活性,因此能夠在GPU和CPU平臺上進行訓練和推理,來調整翻譯模型的性能。

關於培訓,該團隊實施了內存優化,如blob回收和blob重新計算,這有助於更大批量的培訓,並更快地完成培訓。 關於推理,該團隊使用專門的向量數學庫和權重量化來提高計算效率。 現有模式的早期基準表明,支持2000多個翻譯方向的計算資源將會非常高。 然而,Caffe2的靈活性和該團隊使用的優化模型使計算提高了2.5倍的效率,因而能夠將神經機器翻譯模型應用到實際中去。

該團隊還遵循在機器翻譯中常用的在解碼時使用波束搜索的做法,以根據模型改進對最可能輸出的句子的估計。 利用Caffe2中的循環神經網絡(RNN)抽象的一般性來實現波束搜索,直接作為單個前向網絡計算,這樣就實現了快速有效的推理。

在這項工作的過程中,該團隊還開發了RNN構建塊,如LSTM,乘法集成LSTM和注意。 這項技術將作為Caffe2的一部分分享出來,並為研究和開源社區提供學習素材。

正在進行的工作

Facebook人工智慧研究(FAIR)團隊最近發表了使用卷積神經網絡(CNN)進行機器翻譯的研究。 Facebook 代碼團隊與 FAIR 密切合作,在不到三個月的時間裡,完成了將這項技術從研究到首次投入生產系統中使用的流程。 他們推出了從英文到法文和從英文到德文翻譯的CNN模型,與以前的系統相比,BLEU的質量提升分別提高了12.0%(+4.3)和14.4%(+3.4)。 這些質量改進讓該團隊看到CNN將成為一個令人興奮的新發展道路,後面他們還將將繼續努力,利用CNN推出更多的翻譯系統。

目前機器翻譯剛剛開始使用更多的翻譯語境。 神經網絡開闢了許多與添加更多上下文相關的發展方向,以創建更好的翻譯,例如伴隨文章文本的照片。

該團隊也開始同時探索可以翻譯許多不同語言方向的多語種模式。 這將有助於解決與特定語言對相關的每個系統的微調的挑戰,並且還可以通過共享培訓數據為某些翻譯方向帶來質量提高。

對Facebook而言,完成從短語到神經機器翻譯的過渡,是一個裡程碑,代表了為所有人提供他們常用語言下的更優質的Facebook體驗。 他們還將繼續推進神經機器翻譯技術,目的是為Facebook上的每個人提供人性化的翻譯。

via code.facebook.com 雷鋒網(公眾號:雷鋒網) AI 科技評論編譯

雷鋒網版權文章,未經授權禁止轉載。詳情見轉載須知。

相關焦點

  • 谷歌申請神經網絡翻譯專利,專家表示淡定,Facebook呢?
    兩周以前,谷歌宣布把自己的語義分析程序開源,現在,基於語義分析的神經網絡翻譯系統專利被公諸於世。2015 年十月,谷歌提交了這份專利申請,名為「神經機器關鍵字處理翻譯系統「,在 2016 年四月 28 日發布,谷歌為這項技術的具體實現方式申請了專利。谷歌將這項神經網絡MT(機器翻譯)系統的技術定義為「一個將兩種自然語言相互映射的神經網絡系統」。這項專利的關注點主要集中在具體映射的方法上,然而,專利中包含了大量侵權索賠條款。
  • 谷歌推神經網絡翻譯 中譯英水平匹敵真人
    在谷歌發表的題為《規模生產中的神經網絡機器翻譯》(A Neural Network for Machine Translation, at Production Scale)的文章中,宣布將機器學習技術納入網頁和手機APP翻譯中,從前漢譯英的尷尬局面將大為扭轉。翻譯系統面世後,根據用戶們的測試,發現漢譯英的準確率高得驚人。
  • 谷歌推出神經網絡翻譯 中譯英水平匹敵真人?
    在谷歌發表的題為《規模生產中的神經網絡機器翻譯》(A Neural Network for Machine Translation, at Production Scale)的文章中,宣布將機器學習技術納入網頁和手機APP翻譯中,從前漢譯英的尷尬局面將大為扭轉。  翻譯系統面世後,根據用戶們的測試,發現漢譯英的準確率高得驚人。
  • 用人工智慧預測有機化學反應——來自翻譯神經網絡的啟發
    通過將原子當作字母,分子當作單詞,IBM的人工智慧軟體正在借用機器原先翻譯語言的方法,來預測有機化學反應的產物,這可能會加快新藥開發的速度。IBM的科學家換了一種思路,他們找了通常用於語言翻譯的AI程序應用在有機化學上。
  • 網易有道上線神經網絡翻譯
    【IT168 廠商動態】在機器翻譯領域深耕了近十年的網易有道,再次給人們帶來了驚喜。  近日,網易有道在GMIC(全球移動網際網路大會)未來創新峰會上公布:由網易公司自主研發的神經網絡翻譯( Neural Machine Translation,以下簡稱NMT)技術正式上線。
  • Facebook啟用基於人工智慧的翻譯系統來翻譯帖子和評論
    ­  Facebook所提供的翻譯並不十分準確,不過這種情況在未來會有極大改觀。今天,Facebook宣布徹底擺脫過去基於短語的翻譯系統,已經成功過渡切換至基於人工智慧的神經機器翻譯系統(NMT)。
  • 新譯科技:混合神經網絡算法使智能機器翻譯實現顛覆性突破
    新譯科技:混合神經網絡算法使智能機器翻譯實現顛覆性突破時間:2017-05-19 14:09   來源:中華網   責任編輯:青青 川北在線核心提示:原標題:新譯科技:混合神經網絡算法使智能機器翻譯實現顛覆性突破 在智能化的今天,傳統語言翻譯迎來智能化浪潮。
  • Facebook開源多款AI工具,支持遊戲、翻譯
    翻譯 | 林椿眄編輯 | 阿司匹林出品 | AI科技大本營近日,Facebook 在年度開發者大會 F8 上宣布開源多款 AI 工具,除了 PyTorch、Caffe 等深度學習框架之外,此次開源的還包括 DensePose(可用於人體姿態估計)、Translate(可翻譯 48 種語言)、ELF(可通過遊戲來教機器推理)等諸多 Facebook 內部使用的庫和模型。
  • Caffe2新增RNN支持,Facebook全面轉向神經機器翻譯
    本文由機器之心編輯,「機器之心」專注生產人工智慧專業性內容,適合開發者和從業者閱讀參考。點擊右上角即刻關注。近日,Facebook 共享了 Caffe2 在支持循環神經網絡(RNN)方面的最新成果。通過 Caffe2 RNN,Facebook 的神經機器翻譯的效率提升高達 2.5x,Facebook 全部的機器翻譯模型從基於短語的系統轉換為所有語言的神經模型。這意味著 Facebook 可在產品中部署神經機器翻譯了。我們很高興共享 Caffe2 在支持循環神經網絡(RNN)方面的最新成果。
  • 人工智慧發展史,機器學習/神經網絡與其關係
    人工智慧是指讓機器獲得像人類一樣思考與處理事情能力的技術,最早出現在 1956 年召開的達特茅斯會議上。這次會議主要討論著一個在當時看來完全不食人間煙火的主題:用機器來模仿人類學習以及其他方面的智能。人工智慧是一項極具挑戰性的任務。
  • 百度聯合攜程推出人工智慧翻譯機,支持多種翻譯方式;「釘釘」宣布...
    百度聯合攜程推出人工智慧翻譯機,支持多種翻譯方式   2. 「釘釘」宣布啟動國際化戰略   3. 京東依託微信「購物」頻道推出「電商超級入口」,建立社交電商生態   4. 支付寶小程序開放多個觸達用戶的場景渠道   5.
  • 人工智慧全面爆發?智能翻譯有可能是突破口
    一時間,「機器同傳」這一人工智慧產物迅速成為大眾視野中的「網紅」,繼阿爾法狗(AlphaGo)後,人工智慧再次引爆眼球。機器翻譯,做秀吹牛還是真風口?正所謂人紅是非多,機器同傳的表現既驚豔又充滿爭議。經歷了60年發展的人工智慧,目前正在經歷第三次浪潮,其特點是基於神經網絡領域的全新進展,以深度神經網絡為基礎,以大數據、雲計算後臺為運算平臺,基於移動網際網路源源不斷地把各種訓練數據收到後臺,通過深度學習能力進行特徵數據挖掘和快速訓練。前文提到的「機器同傳」技術,其實就是人工智慧進入正式使用階段的形式之一。
  • Facebook AI發明會算高數的神經網絡,表現碾壓MATLAB
    他們訓練了一套神經網絡來執行必要的符號推理和數學運算,首次實現了數學表達式的微分和積分。這項成果是邁向更強大的數學推理工具的重要一步,也是利用神經網絡的新方法。在發現和識別規律上,神經網絡可以有很好的表現,因此我們用它來執行面部識別、物體識別和自然語言識別等任務。
  • 壓縮26倍,神經網絡仍高效,Facebook新研究造福嵌入式設備
    魚羊 發自 凹非寺量子位 報導 | 公眾號 QbitAI人工智慧風暴襲來,機器人、自動駕駛汽車這樣的嵌入式設備也熱度漸長。毫無疑問,現在,嵌入式設備也需要高效的神經網絡加持。但是,如何在嵌入式設備上實現高效的神經網絡,可不是一件簡單的事情。性能,功耗,成本,都是不得不考慮的問題。每一種不同的應用場景,都需要在神經網絡的大小和精確度之間進行特定的權衡(trade-off)。
  • Facebook開源機器學習翻譯項目fairseq
    雷鋒網了解到,今天,Facebook的人工智慧研究團隊發表了他們的研究成果Fairseq,他們使用了一種新型的卷積神經網絡來做語言翻譯,比循環神經網絡的速度快了9倍,而且準確性也是現有模型中最高的。此外,FAIR序列建模工具包的原始碼和訓練好的系統都已經在開源平臺GitHub上公布,其他的研究者可以在此基礎上建立自己的關於翻譯、文本總結和其他任務的模型。
  • 網易有道上線神經網絡翻譯 質量或媲美英語八級
    在機器翻譯領域深耕了近十年的網易有道,再次給人們帶來了驚喜。近日,網易有道在GMIC(全球移動網際網路大會)未來創新峰會上公布:由網易公司自主研發的神經網絡翻譯( Neural Machine Translation,以下簡稱NMT)技術正式上線。
  • Facebook開源TTS神經網絡VoiceLoop:基於室外聲音的語音合成
    本文由機器之心編輯,「機器之心」專注生產人工智慧專業性內容,適合開發者和從業者閱讀參考。點擊右上角即刻關注。近日,Facebook 在題為《Voice Synthesis for in-the-Wild Speakers via a Phonological Loop》的論文中提出一個文本轉語音(TTS)的新神經網絡VoiceLoop,它能夠把文本轉化為在室外採樣的聲音中的語音。
  • 網易有道上線神經網絡翻譯質量媲美英語八級
    在機器翻譯領域深耕了近十年的網易有道,再次給人們帶來了驚喜。近日,網易有道在GMIC(全球移動網際網路大會)未來創新峰會上公布:由網易公司自主研發的神經網絡翻譯(NeuralMachineTranslation,以下簡稱NMT)技術正式上線。
  • 英漢翻譯so easy!谷歌發布神經網絡翻譯系統
    谷歌發布神經網絡翻譯系統 Google今天宣布發布Google神經網路機器翻譯系統(Google Neural Machine Translation),簡稱GNMT,使用當前最先進的訓練技術,能夠實現到迄今為止機器翻譯質量的最大提升。
  • 人工智慧翻譯 OR 人工翻譯?
    當今,人工智慧已在能源、健康、機器人、商業情報、教育和金融等領域產生了深遠影響。隨著2018博鰲亞洲論壇,「騰訊同傳」事件引發的熱烈的討論,人工智慧翻譯(或機器翻譯)與人工翻譯未來發展的討論再一次出現在人們面前。其實早在上世紀30年代,就有了機器翻譯語言的想法和實踐。