深度學習在統計機器翻譯和會話中的應用 |微軟IJCAI2016演講PPT

2021-01-10 雷鋒網

微軟研究院在IJCAI2016的Tutorial上講述了自己將深度學習、深度神經網絡應用於不同場景的情況,之前第一部分提到了其應用於語義理解上的一些經驗和收穫,本文為第二部分。

聯合編譯:Blake、章敏、陳圳

統計機器翻譯(SMT)包括:

l  統計結果

l  來源渠道模型

l  翻譯模型

l  語言模型

l  對數線性模型

l  評價指標:BLEU分數(越高越好)

基於短語的統計機器翻譯(SMT)將中文翻譯成英文

核心問題:針對什麼建模?

l  針對詞彙可能性

   語言模型

   LM/w 來源

l  基於短語的機器翻譯  翻譯/錄製可能性

   翻譯

   錄製

l  基於二元的機器翻譯

l  ITG模型

神經網絡在基於短語的SMT中的示例

l  神經網絡作為線性模型中的組成部分

   翻譯模型

   預壓模型 捲曲神經網絡的使用

   聯合模型 FFLM與原始詞彙

l  神經機器翻譯(NMT)

   建立一個單一、大型的神經網絡用來讀取句子並輸出翻譯

   RNN 編碼-解碼

   長短時期記憶

   聯合學習順序、翻譯

   NMT在WMT任務上超過了最好的結果

短語翻譯模型雖然簡單,但是解決了數據稀少的問題。

深度語義相似模型(DSSM)

l  計算語義相似性btw文本

l  針對自然語義處理任務的DSSM

DSSM 針對短語翻譯模型

l  兩個神經網絡(一個是來源方向,一個是導向方向)

   輸入

   輸出

l  短語翻譯分數=矢量點積

   分數

   為了緩解數據稀疏性,允許複雜的分數函數

N-gram語言模型

l  詞語n-gram模型(如n=3)

l  使用長歷史的問題

    稀少的事件:不可靠的可能性預估

RNN LMs需要返回到句子剛開始的時段,這也使得動態規劃更加困難。為了給新詞彙評分每一個解碼器的狀態都需要維持在h,通過傳統的n-gram語境和最好的h來合併假設,進行重新組合。

模擬S需要3個條件:1.整個源句子或者均衡的源詞彙 2.S作為詞彙序列,詞彙包,或者矢量代表 3.如何學習S的矢量代表?神經網絡聯合模型基於遞歸神經網絡語言模型和前饋神經語言模型。

前饋神經語言模型

擴展前饋LM,使它包含周圍有均衡源詞彙的窗口。如果要對齊多個源詞彙,選擇正中間的位置;如果無需對齊,則繼承最近目標詞彙的隊列。同時用隊列在文本中進行訓練;優化目標的可能性。

神經機器翻譯,建立一個單獨的,大型的NN,閱讀句子並輸入翻譯。不像基於短語的系統需要很多零件模型組成。編碼器-解碼器基礎方法是:一個編碼器RNN進行閱讀和將一個源句子編碼到固定長度的矢量中,一個解碼器RNN從編碼器矢量中輸出可變長度的翻譯,最後編碼器-解碼器RNNs聯合學習文本,優化目標可能性。

[Sutskever+2014]編碼器-解碼器模型

將MT當成普遍的序列到序列的翻譯,閱讀源頭;累積隱狀態;生成目標。其中<EOS>是停止遞歸進程的符號。在練習中,反向閱讀源句子會導致更好的MT結果。在文本中進行訓練,並使用SGD優化目標可能性。

潛能和困難

在理論上,RNN可以將所有過去輸入的信息「儲存」在h中,但在現實中標準的RNN無法捕獲長距離的依賴。解決反向傳播中梯度消失和爆炸和不穩定噪音問題的方法是:長的短期記憶。

長短期記憶細胞

RNN中一個LSTM單元的信息流的圖解和數學公式。W`s是權重矩陣,雖然沒有顯示但可以從圖中輕鬆的推理出來。

兩個門的記憶細胞

圖2:提出的隱激活函數。更新門z決定隱藏狀態是否更新了新的隱藏狀態h。復位門r決定先前的隱藏狀態是否被忽略。

排列和翻譯的聯合學習

SMT編碼器-解碼器模型存在一個問題問題:壓縮源信息到一個固定長度矢量中,使得RNN很難複雜長句子。注意力模型就是:編碼輸入句子到矢量隊列,並在解碼時選擇矢量的子集

它類似的想法於[Devlin+14]。

 [ Bahdanan+15]的注意力模型

編碼器:雙向RNN編碼每一個單詞和文本

解碼器:尋找一系列與預測的目標詞彙最相關的源詞彙,並基於源詞彙和所有先前生成詞彙相關的文本矢量預測目標詞彙。這樣翻譯長句子的表現接近最佳性能。

 MSR`s神經對話引擎

總結:

這一部分主要介紹了深度神經網絡對於問題進行分類的實例,以及在統計機器翻譯和對話中深度學習的應用,對於語義表達學習和自然語言的理解也有所提及。

PS : 本文由雷鋒網(公眾號:雷鋒網)獨家編譯,未經許可拒絕轉載!

雷鋒網原創文章,未經授權禁止轉載。詳情見轉載須知。

相關焦點

  • 自然語言的理解和連續表達 | 微軟IJCAI 2016演講PPT
    微軟研究院在IJCAI2016的Tutorial上講述了自己將深度學習、深度神經網絡應用於不同場景的情況,之前第二部分提到了深度學習在統計機器翻譯和會話中的應用,第三部分是選中自然語言處理任務的連續表達。
  • 【IJCAI 2018】30大 Tutorial,人工智慧百花齊放
    在這次會議上,人工智慧和機器學習領域的研究者為我們呈現了這一領域的研究前沿,其中包括:約束學習Constraint Learning、生成對抗網絡(GAN)、博弈論、AI倫理 等等,呈現出很強的多樣性;與此同時,一些資深研究者也帶來了一些極具看點和啟發價值的演講和教程
  • iDST院長金榕IJCAI演講:阿里巴巴的深度學習應用(附PPT)
    :深度學習過去十年在各個領域都取得了巨大的成功,但當把深度學習技術應用到實際問題中時,常會遇到諸多挑戰。阿里巴巴作為在電商領域有諸多業務的企業,對深度學習有很大的需求,不可避免地當他們將深度學習應用到業務中時會遇到許多學界人士不可能遇到的問題。
  • 微軟人工智慧又一裡程碑:微軟中-英機器翻譯水平可「與人類媲美」
    跨時區跨領域合作,四大技術為創新加持雖然學術界和產業界的科研人員致力於機器翻譯研究很多年,但近兩年深度神經網絡的使用讓機器翻譯的表現取得了很多實質性突破,翻譯結果相較於以往的統計機器翻譯結果更加自然流暢。為了能夠取得中-英翻譯的裡程碑式突破,來自微軟亞洲研究院和雷德蒙研究院的三個研究組,進行了跨越中美時區、跨越研究領域的聯合創新。
  • AI會話能力超越人類!CoQA挑戰賽微軟創新紀錄
    5月4日,在史丹福大學的會話問答(CoQA)挑戰賽中,AI的會話能力已媲美人類,並以0.6分優勢全面「碾壓」人類水平!也就是說,人類與這個模型互動更像是與真人之間的交流。CoQA挑戰賽通過理解文本段落,並回答對話中出現的一系列相互關聯的問題,來衡量機器的性能。此次,微軟亞研院NLP團隊和微軟Redmond語音對話團隊聯手組成黃金搭檔參賽。
  • CCL 2016| 中科院張鈸院士:後深度學習時代的計算語言學
    跨過統計學的四個裡程碑、機器學習模型的發展及文本的機器學習模型等,再到文本語義鴻溝問題,一般情況語義和底層特徵之間的映射不存在,於是引出了從淺層學習到深度學習,深度學習在語言處理中的應用以及深度學習解決問題的範圍。
  • 微軟宣布其中英機器翻譯水平可與人類相當
    跨時區跨領域合作,四大技術為創新加持雖然學術界和產業界的科研人員致力於機器翻譯研究很多年,但近兩年深度神經網絡的使用讓機器翻譯的表現取得了很多實質性突破,翻譯結果相較於以往的統計機器翻譯結果更加自然流暢。為了能夠取得中-英翻譯的裡程碑式突破,來自微軟亞洲研究院和雷德蒙研究院的三個研究組,進行了跨越中美時區、跨越研究領域的聯合創新。
  • 微軟亞研院副院長周明:口語機器翻譯在未來肯定會完全普及
    第三,所謂的深度學習技術,實現了點對點、端對端的訓練。你需要做的就是掌握並整理標註的數據,放到深度學習框架裡面,它自動學習,自動抽取課程完成你所需要完成的任務。這使得機器學習的門檻大幅度下降,人工智慧可以走向平民化,很多領域都可以用人工智慧實現。此外,還有重要的一點,就是落地的場景,這是過去兩次浪潮都沒有的。過去都是套用系統,做一些小遊戲、小玩具,比如做一個小問答系統。
  • 學界 KDD 2016 演講和論壇視頻出爐:深度學習是一切問題的終極答案嗎?
    近日,KDD 2016 期間的一些演講和研討會視頻陸續公開,機器之心對其進行了簡單梳理,視頻內容請查閱 http://videolectures.net/kdd2016_sanfrancisco/ 或 KDD 2016 Video YouTube 頻道 https://www.youtube.com/channel/UCPsUUDUlcTJuP-fRa7z85aQ?app=desktop。
  • 機器翻譯新突破,微軟中英新聞翻譯達人類水平
    近兩年隨著深度神經網絡的引入,機器翻譯的表現取得了很多顯著的提升,翻譯結果相較於以往的統計機器翻譯結果更加的自然流暢。對偶無監督學習框架對偶學習,即利用任務的對偶結構來進行學習。例如,在翻譯領域,我們關心從英文翻譯到中文,也同樣關心從中文翻譯回英文。由於存在這樣的對偶結構,兩個任務可以互相提供反饋信息,而這些反饋信息可以用來訓練深度學習模型。也就是說,即便沒有人為標註的數據,有了對偶結構也可以做深度學習。
  • 日本推醫用語音翻譯系統
    雖然可以依賴翻譯或是通過手勢進行交流,但在醫學這種追求嚴謹的領域,容不得半點「誤解」。隨著海外就醫越來越普遍,最近日本情報通信研究機構(NICT)就與富士通聯合推出了醫用多語種語音翻譯系統,並表示已經進入應用試驗階段。
  • 微軟機器翻譯新突破 中譯英水平可與人類相當
    繼在語音識別和機器閱讀領域取得的「過人」成績,由微軟亞洲研究院與雷德蒙研究院的研究人員組成的團隊今天宣布,其研發的機器翻譯系統在通用新聞報導測試集newstest2017的中-英測試集上,達到了可與人工翻譯媲美的水平。這是首個在新聞報導的翻譯質量和準確率上可以比肩人工翻譯的翻譯系統。
  • 同聲翻譯要失業了!微軟剛剛宣布:中英機器翻譯可與人類媲美
    微軟機器翻譯團隊研究經理Arul Menezes雖然學術界和產業界的科研人員致力於機器翻譯研究很多年,但近兩年深度神經網絡的使用讓機器翻譯的表現取得了很多實質性突破,翻譯結果相較於以往的統計機器翻譯結果更加自然流暢
  • 微軟宣布在「機器中英雙語翻譯」領域取得突破性進展
    本周三,微軟的研究團隊宣布發明了第一個機器翻譯系統,可以自動將中文文章翻譯成英文,翻譯精度能和人類水平相當。研究團隊抽取並測試了在線新聞中近2000個中文句子的中譯英,這份樣本被稱為newstest2017,再和人工翻譯進行結果對比,還聘請了雙語專家來驗證機器翻譯的準確性。
  • 從冷戰到深度學習:一篇圖文並茂的機器翻譯史
    從早期的基於規則的機器翻譯到如今廣泛應用的神經機器翻譯,機器翻譯的水平不斷提升,已經能滿足很多場景的基本應用需求了。近日,Ilya Pestov 用俄語寫的機器翻譯介紹文章經 Vasily Zubarev 翻譯後發表到了 Vas3k.com 上。機器之心又經授權將其轉譯成了漢語。希望有一天,機器自己就能幫助我們完成這樣的任務。
  • 又一裡程碑:微軟宣布中英機器翻譯達到人類水平
    跨時區跨領域合作雖然學術界和產業界的科研人員致力於機器翻譯研究很多年,但近兩年深度神經網絡的使用讓機器翻譯的表現取得了很多實質性突破,翻譯結果相較於以往的統計機器翻譯結果更加自然流暢。為了能夠取得中-英翻譯的裡程碑式突破,來自微軟亞洲研究院和雷德蒙研究院的三個研究組,進行了跨越中美時區、跨越研究領域的聯合創新。
  • 微軟Translator 重大更新,「掃一掃」就能免費體驗多語言的實時翻譯
    那麼你們如何聽得懂解說員的講解,又和對方輕鬆交談呢?現在,更新後的 Microsoft  Translator 軟體將幫你解決這一難題。據 Cnet 等多家外媒報導,微軟將翻譯軟體增加了 Translator Live 實時翻譯功能。用戶可以使用聯網的智慧型手機、平板電腦和 PC 等設備,在多人、多語言、面對面交談時享受實時翻譯的體驗。
  • 演講| 微軟亞洲研究院劉鐵巖:對偶學習推動人工智慧的新浪潮
    機器之心整理演講:劉鐵巖12 月 17 日,中國人工智慧學會、中國工程院戰略諮詢中心主辦,今日頭條、IEEE《計算科學評論》協辦的 2016 機器智能前沿論壇暨 2016 BYTE CUP 國際機器學習競賽頒獎儀式在中國工程院舉辦,論壇邀請到今日頭條、微軟、IBM 等業界科學家以及清華大學、北京大學、Santa Fe 研究所、Georgia Institute
  • WSDM 2019教程—李航、何向南等,深度學習匹配在搜索和推薦中的應用
    ,機器翻譯,對話系統)都可以抽象成文本匹配問題。過去傳統的匹配問題只要集中在人工定義特徵之上的關係學習,模型的效果很依賴特徵的設計。而深度學習的引入,能夠從大量數據中自動學習特徵表示,並且能夠更好的擬合複雜的交互關係。在WSDM 2019上來自中國人民大學的徐君研究員,中科大的何向南教授,以及今日頭條副總裁李航博士共同帶來深度學習匹配搜索和推薦深度學習匹配在搜索和推薦中這兩個任務中的應用。
  • 深度學習應用於機器翻譯的魔力
    但我們都知道,高中生一直在使用谷歌翻譯...嗯... 協助他們的西班牙語作業15年。這不是舊聞嗎?事實證明,在過去兩年中,深度學習完全改寫了我們的機器翻譯方法。對語言翻譯幾乎一無所知的深度學習研究人員正在將相對簡單的機器學習解決方案放在一起,這些解決方案擊敗了世界上最好的專家構建的語言翻譯系統。