微軟亞研院副院長周明:口語機器翻譯在未來肯定會完全普及

2020-12-11 極客公園

作者:

隨著智能語音助手、聊天機器人(Chatbot)等產品逐漸成熟,出現在普通用戶的眼前,其中的一些核心技術也正變得越來越重要、越來越受到大家的關注。自然語言處理技術(Nature Language Processing,簡稱 NLP)就是其中之一。

近日,微軟亞洲研究院副院長周明博士就自然語言處理技術的概況、最新進展及未來發展方向對外界做了一次分享,極客公園也藉機與周明博士進行了交流,下面,我們就把其中的內容介紹給大家,通過這場分享,或許我們能對自然語言處理這項技術有更全面的理解。

概述:人工智慧技術整體的發展狀況

人工智慧經過 61 年的發展,起起伏伏,曾經歷過兩次冬天,隨著雲計算、大數據、深度學習三大要素的交織下,人工智慧又迎來了一個新的春天。而這次人工智慧春天的特點有以下三點:

第一,數據比以前大了很多倍。以前做人工智慧基本上是請一些專家錄入數據寫一些簡單的規則,現在都海量的數據,包括網際網路數據。

第二,計算的能力大大發展。以雲計算為代表的計算能力使人們在訓練或實施時不用再擔心。以前的 PC 機能力非常有限。

第三,所謂的深度學習技術,實現了點對點、端對端的訓練。你需要做的就是掌握並整理標註的數據,放到深度學習框架裡面,它自動學習,自動抽取課程完成你所需要完成的任務。這使得機器學習的門檻大幅度下降,人工智慧可以走向平民化,很多領域都可以用人工智慧實現。

此外,還有重要的一點,就是落地的場景,這是過去兩次浪潮都沒有的。過去都是套用系統,做一些小遊戲、小玩具,比如做一個小問答系統。而現在的人工智慧是有實實在在的應用場景,比如說現在億萬網民都在使用的搜尋引擎背後就有很多人工智慧的系統;自動駕駛汽車從感知到認知都用到了很多人工智慧技術。

(微軟亞洲研究院副院長周明博士)

這個場景有什麼好處呢?一開始技術是有限的,能力是有問題的,隨著越來越多人將其作為剛需使用,自然而然提供了海量的反饋,整個系統就可以不斷提升。比如說搜尋引擎,網民使用搜尋引擎實際上也在幫助搜尋引擎訓練。

自然語言處理技術的概況

人工智慧是用電腦來模擬和實現人類的智能,而人類的智能大概分如下幾個層次:運算智能、感知智能、認知智能以及最高一層的創造智能。其中,自然語言處理技術主要屬於第三層認知智能這一部分。

自然語言處理是體現語言智能重要的技術,它是人工智慧一個重要的分支,能幫助機器分析、理解或者生成自然語言,實現人與機器的自然交流,同時也幫助人與人之間的交流。

自然語言處理包括以下幾方面內容:

第一是 NLP 的基礎技術,圍繞不同層次的自然語言處理,比如說分詞、詞性標註、語義分析做一些加工。後面做任何其他新的技術或者應用都必須要用到基礎技術。

中間這塊是 NLP 核心技術,包括詞彙、短語、句子、篇章的表示,大家所說的 Word Embedding 就是在研究不同的語言單位的表示方法。它也包括機器翻譯、提問和回答、信息檢索、信息抽取、聊天和對話、知識工程、語言生成、推薦系統。

最後是「NLP+」,仿照「人工智慧+」或「網際網路+」的概念,實際上就是把自然語言處理技術深入到各個應用系統和垂直領域中。比較有名的是搜尋引擎、智能客服、商業智能和語音助手,還有更多在垂直領域——法律、醫療、教育等各個方面的應用。

從四個方面介紹 NLP 的進展

首先介紹機器翻譯的進展

微軟這兩年在機器翻譯上有了新的長足的進步,首先是在語音翻譯上全面採用了神經網絡機器翻譯,並拓展了新的翻譯功能,叫做 Microsoft Translator Live Feature(現場翻譯功能),在演講和開會時,實時自動在手機端或桌面端,把演講者的話翻譯成多種語言。

這張圖概括了神經網絡機器翻譯,簡要的說,就是對源語言的句子進行編碼,一般都是用長短時記憶 LSTM 進行編碼。編碼的結果就是有很多隱節點,每個隱節點代表從句首到當前詞彙為止,與句子的語義信息。基於這些隱節點,通過一個注意力的模型來體現不同隱節點對於翻譯目標詞的作用。通過這樣的一個模式對目標語言可以逐詞進行生成,直到生成句尾。中間在某一階段可能會有多個翻譯,我們會保留最佳的翻譯,從左到右持續。

這裡最重要的技術是對於源語言的編碼,還有體現不同詞彙翻譯的,不同作用的注意力模型。此外,微軟還持續做了一些工作,其中主要有兩個方面。

第一,引入語言知識。因為在編碼的時候是僅把源語言和目標語言看成字符串,沒有體會內在的詞彙和詞彙之間的修飾關係。我們把句法知識引入到神經網絡編碼、解碼之中,這是傳統的長短時記憶 LSTM,這是模型,我們引入了句法,得到了更佳的翻譯,這是大家看到的指標有了很大程度的提升。

第二,引入領域內的知識圖譜。微軟想把知識圖譜納入到傳統的神經網絡機器翻譯當中,來規劃語言理解的過程。其中的一個假設就是雖然大家的語言可能不一樣,但是體現在知識圖譜的領域上可能是一致的,就用知識圖譜增強編碼、解碼。具體來講,就是對於輸入句子,先映射到知識圖譜,然後再基於知識圖譜增強解碼過程,使得譯文得到進一步改善。

其次是中國文化的部分

2004 年的時候,微軟就已經在對聯的部分嘗試過用機器翻譯的技術來模擬對聯的全過程。而最近,在微軟對聯的基礎上,他們又繼續去嘗試其他的中國文化,其中有一個特色就是字謎。

字謎是給你謎面讓你猜謎底。當然也可以反過來,給定一個謎底,讓你出謎面。現在,已經可以用電腦來模擬整個猜字謎和出字謎的過程了,我們也把這個功能放在了微軟對聯的網站上。

同時,微軟亞洲研究院的宋睿華博士最近就在用這種神經網絡的技術來進行詩歌的創作。這件事非常有創意:用戶提交一個照片,讓系統進行,然後變成一首詩,自由體的詩。大概兩周以前,微軟小冰發布了微軟小冰寫詩的技能,引起了很多人的關注。這種把人工智慧和中國文化巧妙結合起來的方式也很有創意。

對話即平臺

下一個方向是「對話即平臺」,英文叫做「Conversation as a Platform(CaaP)」。2016 年,微軟執行長薩提亞在大會上提出了 CaaP 這個概念,他認為繼圖形界面的下一代就是對話,它會對整個人工智慧、計算機設備帶來一場新的革命。

提出這個概念有兩個原因。

第一個原因源於大家都已經習慣用社交手段,如微信、Facebook 與他人聊天的過程。微軟希望將這種通過自然的語言交流的過程呈現在當今的人機互動中,而語音交流的背後就是對話平臺。

第二個原因則在於,現在大家面對的設備有的屏幕很小,有的甚至沒有屏幕,所以通過語音的交互,更為自然直觀的。因此,我們是需要對話式的自然語言交流的,通過語音助手來幫忙完成。

而在產品策略上,微軟在做 CaaP 的時候實際上有兩個主要的產品策略。

第一個是小娜,通過手機和智能設備介入,讓人與電腦進行交流:人發布命令,小娜理解並執行任務。第二個就是小冰。它是一種新的理念,就是人與它之間的閒聊。

而無論是小冰這種閒聊,還是小娜這種注重任務執行的技術,其實背後單元處理引擎無外乎就三層技術。

第一層:通用聊天,需要掌握溝通技巧、通用聊天數據、主題聊天數據,還要知道用戶畫像,投其所好。

第二層:信息服務和問答,需要搜索的能力,問答的能力,還需要對常見問題表進行收集、整理和搜索,從知識圖表、文檔和圖表中找出相應信息,並且回答問題,我們統稱為 Info Bot。

第三層:面向特定任務的對話能力,例如定咖啡、定花、買火車票,這個任務是固定的,狀態也是固定的,狀態轉移也是清晰的,那麼就可以用 Bot 一個一個實現。你有一個調度系統,你知道用戶的意圖就調用相應的 Bot 執行相應的任務。它用到的技術就是對用戶意圖的理解,對話的管理,領域知識,對話圖譜等等。

為了把這種能力釋放出去,讓每個人都能夠體驗人工智慧的好處,微軟開發了一個叫 Bot Framework 的工具、平臺,任何一個開發者只用幾行代碼就可以完成自己所需要的 Bot。

最後一個方面是閱讀理解

閱讀理解顧名思義就是給你一篇文章,看你理解到什麼程度。為了推動閱讀理解的發展,美國史丹福大學就開發了一個測試題,也開放給大眾。它既有訓練的部分,也有開發的部分,還有測試的部分。每個參賽隊伍拿到測試題目,自己進行訓練。通過開發調自己的參數,最後提交自己的系統,然後史丹福大學就把你的成績公布到他的網站上。

從去年 9 月份到現在,微軟亞洲研究院一直名列第一。現在人工閱讀的正確率能做到 82% 左右,而現在我們微軟亞洲研究院的結果在 76% 左右,與人類水平還差 5 分左右。在閱讀理解這樣難的技術上,我們可以清醒的認識到還有很長的路要走。其實就包括對常識知識的把握、推理的能力,還有識別問題、上下文理解的問題等等。

NLP 未來的發展方向

第一,隨著大數據、深度學習、雲計算這三大要素推動,所謂認知智能,尤其是語言智能跟感知智能一樣會有長足的發展。從初步的應用到搜索、聊天機器人上,到通過對上下文的理解,知識的把握,它的處理能力得到長足的進步。具體來講,口語機器翻譯肯定會完全普及,任何人出國,無論到了哪個國家,拿起電話來你說你的母語,跟當地人交流不會有太大的問題,而且是非常自如的過程,就跟你打電話一樣。雖然這不意味著同聲翻譯能徹底顛覆,也不意味著這種專業領域的文獻的翻譯可以徹底解決;但我認為還是會有很大的進展。

第二,自然語言的會話、聊天、問答、達到實用程度。這意味著在常見的場景下,通過人機對話的過程完成某項任務,這個是可以完全實現,包括帶口音的說話都可以完全聽懂。但是同樣,這也不代表任何話題、任何任務、用任何變種的語言去說都可以達到。目前離那個目標還很遠,我們也在努力。

第三,智能客服加上人工客服完美的結合,一定會大大提高客服的效率。我認為很多重複的客服工作,比如說問答,還有簡單的任務,基本上人工智慧都可以解決。但是複雜的情況下仍然不能解決。所以,它實際上是人工智慧跟人類智能完美生產線的結合來提高一個很好的生產力,這個是沒有問題的。

第四,自動寫對聯、寫詩、寫新聞稿和歌曲等等,我認為今天可能還是一個新鮮的事物,但是五到十年一定都會流行起來,甚至都會用起來。比如說寫新聞稿,給你一些數據,這個新聞稿草稿馬上就寫出來,你要做的就是糾正,添油加醋,供不同的媒體使用等。

第五,在會話方面,語音助手、物聯網、智能硬體、智能家居等等,凡是用到人機互動的,我認為基本上都可以得到應用,而且促進以上的一些產品推廣。

最後,認知智能、感知智能一起努力,在很多場景下,比如說法律、醫療診斷、醫療諮詢、法律顧問、投融資等等,這些方面自然語言會得到廣泛的應用。

龜途慢慢

相關焦點

  • 未來5到10年內機器翻譯將普及
    專家22日說,人工智慧的一個分支——自然語言處理技術近年來取得很多突破,能代替人類「高翻」的機器翻譯將在未來5到10年內全面普及。 由中國人工智慧學會和中國中文信息學會主辦的2017全球人工智慧技術大會正在北京舉行。
  • 微軟副院長周明:NLP目前存在的問題、以及未來的發展方向
    ,在微軟大廈舉行的自然語言處理前沿技術分享會活動上,微軟亞洲研究院(MSRA)副院長周明博士《自然語言處理前沿技術》為主題,分享了微軟對神經網絡翻譯、聊天機器人等領域的思考,並接受了雷鋒網等媒體的採訪。
  • 專家:機器翻譯將在五到十年全面普及
    微軟亞洲研究院常務副院長周明近日在2017全球人工智慧技術大會自然語言理解分論壇上發表主題演講時說,在未來5年到10年,機器翻譯問題不僅會得到解決,更會實現普及,「我們拿起電話講話,就可直接體驗從中文翻譯成英文,或從英文翻譯成中文」。  不過,周明指出目前機器翻譯在同聲傳譯方面仍沒有得到很解決,專業級翻譯水平的突破還需要時間。
  • 微軟亞洲研究院副院長周明離職,將加入創新工場AI工程院
    12月17日,澎湃新聞(www.thepaper.cn)獲悉,微軟亞洲研究院副院長周明近期已經從微軟離職,加入由李開復創辦的創新工場人工智慧工程院,擔任首席科學家。周明朋友圈截圖周明,1985年畢業於重慶大學,1991年獲哈爾濱工業大學博士學位。1991-1993年清華大學博士後,隨後留校任副教授。1996-1999訪問日本高電社公司領導中日機器翻譯研究。他是中國第一個中英翻譯系統CEMT-I(哈工大1989年)、日本最有名的中日機器翻譯產品J-北京(日本高電社1998年)的研製者。
  • 人工翻譯要失業?專家稱機器翻譯將在5到10年普及
    專家22日說,人工智慧的一個分支—自然語言處理技術近年來取得很多突破,能代替人類「高翻」的機器翻譯將在未來5到10年內全面普及。由中國人工智慧學會和中國中文信息學會主辦的2017全球人工智慧技術大會正在北京舉行。
  • 專家:機器翻譯將在5到10年內全面普及
    專家22日說,人工智慧的一個分支—自然語言處理技術近年來取得很多突破,能代替人類「高翻」的機器翻譯將在未來5到10年內全面普及。  由中國人工智慧學會和中國中文信息學會主辦的2017全球人工智慧技術大會正在北京舉行。
  • 對話MSRA副院長周明:回望過去,展望未來,NLP有哪些發展趨勢?
    在過去幾天機器之心已經發布了對數位頂尖學者的年度專訪,針對不同領域的發展趨勢做了深度對話。本文我們將介紹針對 NLP 領域的發展對微軟亞洲研究院副院長、ACL 主席周明博士的專訪,從宏觀層次和技術層面探討 NLP 的研究進展及未來發展趨勢。
  • 同聲翻譯要失業了!微軟剛剛宣布:中英機器翻譯可與人類媲美
    雖然此次突破意義非凡,但研究人員也提醒大家,這並不代表人類已經完全解決了機器翻譯的問題,只能說明我們離終極目標又更近了一步。微軟亞洲研究院副院長、自然語言計算組負責人周明表示,在WMT17測試集上的翻譯結果達到人類水平很鼓舞人心,但仍有很多挑戰需要我們解決,比如在實時的新聞報導上測試系統等。
  • 微軟機器翻譯新突破 中譯英水平可與人類相當
    雖然此次突破意義非凡,但研究人員也提醒大家,這並不代表人類 已經完全解決 了機器翻譯的問題,只能說明 我們 離終極目標又更近了一步 。微軟亞洲研究院副院長、自然語言計算組負責人周明表示,在WMT17測試集上的翻譯結果達到人類水平很鼓舞人心,但仍有很多挑戰需要我們解決,比如在實時的新聞報導上測試系統等。
  • 機器翻譯新突破,微軟中英新聞翻譯達人類水平
    而新聞(news)測試集則是三類翻譯測試集中的一個,其他兩類為生物醫學(biomedical)和多模式(multimodal)。四大技術我們知道,對於同一個意思人類可以用不同的句子來表達,因此翻譯並沒有標準答案,即使是兩位專業的翻譯人員對於完全相同的句子也會有略微不同的翻譯,而且兩個人的翻譯都不錯。
  • 微軟人工智慧又一裡程碑:微軟中-英機器翻譯水平可「與人類媲美」
    雖然此次突破意義非凡,但研究人員也提醒大家,這並不代表人類已經完全解決了機器翻譯的問題,只能說明我們離終極目標又更近了一步。微軟亞洲研究院副院長、自然語言計算組負責人周明表示,在WMT17測試集上的翻譯結果達到人類水平很鼓舞人心,但仍有很多挑戰需要我們解決,比如在實時的新聞報導上測試系統等。
  • 微軟宣布!中英機器翻譯水平媲美人類
    微軟亞洲研究院副院長、自然語言計算組負責人周明表示,在WMT17測試集上的翻譯結果達到人類水平很鼓舞人心,但仍有很多挑戰需要我們解決,比如在實時的新聞報導上測試系統等。沒有「正確的」翻譯結果newstest2017新聞報導測試集包括約2000個句子,由專業人員從在線報紙樣本翻譯而來。微軟團隊對測試集進行了多輪評估,每次評估會隨機挑選數百個句子翻譯。
  • 消除語言障礙 微軟推出高質量中-英機器翻譯系統
    機器翻譯是科研人員攻堅了數十年的研究領域,曾經很多人都認為機器翻譯根本不可能達到人類翻譯的水平。雖然此次突破意義非凡,但研究人員也提醒大家,這並不代表人類已經完全解決了機器翻譯的問題,只能說明我們離終極目標又更近了一步。
  • 微軟宣布其中英機器翻譯水平可與人類相當
    雖然此次突破意義非凡,但研究人員也提醒大家,這並不代表人類已經完全解決了機器翻譯的問題,只能說明我們離終極目標又更近了一步。微軟亞洲研究院副院長、自然語言計算組負責人周明表示,在WMT17測試集上的翻譯結果達到人類水平很鼓舞人心,但仍有很多挑戰需要我們解決,比如在實時的新聞報導上測試系統等。
  • 又一裡程碑:微軟宣布中英機器翻譯達到人類水平
    微軟亞洲研究院副院長、自然語言計算組負責人周明表示,在WMT17測試集上的翻譯結果達到人類水平很鼓舞人心,但仍有很多挑戰需要我們解決,比如在實時的新聞報導上測試系統等。微軟亞洲研究院副院長、機器學習組負責人劉鐵巖此外,周明帶領的自然語言計算組多年來一直致力於攻克機器翻譯,周明表示,「由於翻譯沒有唯一的標準答案,它更像是一種藝術,因此需要更加複雜的算法和系統去應對
  • 中到英新聞翻譯媲美人類,微軟機器翻譯新突破
    今日,微軟研究團隊表示,微軟和微軟亞研創造了首個在質量與準確率上匹配人類水平的中英新聞機器翻譯系統。黃學東告訴機器之心,他們採用專業人類標註與盲測評分代替 BLEU 分值而具有更高的準確性,且新系統相比於現存的機器翻譯系統有非常大的提升。
  • 微軟新一代人工智慧打破機器翻譯壁壘!漢英翻譯與人類不相上下
    但是,這可能已經行不通了,因為微軟的人工智慧翻譯剛剛解決了一個最不可能完成的挑戰:將漢語翻譯成英語,並且使其翻譯的準確度與能掌握雙語的人類的不相上下。眾所周知,漢語是一門十分困難的語言,一個非漢語母語的人要花好幾年的時間來學好閱讀報紙所需要的3000個漢字。
  • 人工智慧再下一城:機器翻譯提前7年達到人類專業翻譯水平
    這些研究人員預測,未來10年,AI 將在許多活動中超過人類,具體預測見下表:微軟的這次突破,將機器翻譯超越人類業餘譯者的時間,提前了整整7年,遠遠超出了眾多ML研究人員的預想。雖然此次突破意義非凡,但微軟研究人員也提醒大家,這並不代表人類已經完全解決了機器翻譯的問題,只能說明我們離終極目標又更近了一步。
  • 微軟宣布重大裡程碑:中英機器翻譯可與人類媲美
    【環球網科技 記者 林迪】日前,環球網科技記者從微軟亞洲研究院官網了解到,其研究團隊對外宣布,最新研發的機器翻譯系統在通用新聞報導測試集newstest2017的中-英測試集上,達到了可與人工翻譯媲美的水平。
  • 微軟宣布在「機器中英雙語翻譯」領域取得突破性進展
    本周三,微軟的研究團隊宣布發明了第一個機器翻譯系統,可以自動將中文文章翻譯成英文,翻譯精度能和人類水平相當。研究團隊抽取並測試了在線新聞中近2000個中文句子的中譯英,這份樣本被稱為newstest2017,再和人工翻譯進行結果對比,還聘請了雙語專家來驗證機器翻譯的準確性。