微軟技術院士黃學東:以人為師,機器翻譯達人類專業水平

2020-12-06 澎湃新聞

今年是黃學東加入微軟的第25年,但這位微軟老將至今仍活躍在人工智慧領域科學研究的前線。

2018年3月份,他帶領的團隊在機器翻譯領域拿下一項裡程碑式的成就:其研發的機器翻譯系統在通用新聞報導的newstest2017中譯英測試集上,達到了人工翻譯水平。這是首個在新聞報導的翻譯質量和準確率上媲美人工翻譯的翻譯系統。在去年8月,也是在黃學東的帶領下,其團隊在產業標準Switchboard語音識別基準測試中實現了對話語音識別詞錯率(word error rate,簡稱WER),低至5.1%,創造了當時該領域內錯誤率最低紀錄,首次達成與專業速記員持平而優於絕大多數人的表現。

在兩年不到的時間裡,黃學東的團隊接二連三地取得突破。他的成績也獲得了微軟的認可。2017年,他被評選為微軟技術院士(Technical Fellow),這代表著微軟技術人員的最高榮譽,獲得這一榮譽的人還包括圖靈獎得主Butler W Lampson、Charles P. Thacker等。

黃學東

近日,在北京微軟亞洲研究院裡,這位國際電子電氣工程師學會(IEEE)和美國計算機學會(ACM)的雙科院士,微軟認知工具包CNTK的締造者之一,用一口帶著湖南鄉音的普通話接受了澎湃新聞(www.thepaper.cn)的採訪。

從大學時代到加入微軟,踏上25年的技術徵程,再到帶領團隊屢創佳績,黃學東談到了自己為什麼能堅持這麼久的原因:就是想讓語言交流能夠更美好,人與人之間的語言障礙可以消除。目前,黃學東的團隊已經在語音識別的詞錯率上達到了專業速記員的水平,並且在機器翻譯上比肩人類專業譯者。在採訪中,除了談到最新的機器翻譯突破背後的故事外,黃學東還談到了人工智慧技術發展最終是否會取代人的問題,以及中美之間的人工智慧之爭。

以人為師:微軟機器翻譯提前7年超越人類譯者

在2017年,牛津大學曾向機器學習(Machine Learning)的研究人員做過一項調查,調查的內容是對人工智慧未來發展的預測。根據這些研究人員的預測,未來10年的人工智慧會在很多方面超過人類。其中,他們預測機器翻譯想要超過人類業餘譯者需要8年時間。

根據這項預測,微軟今年3月份研發出的機器翻譯系統,實際上將機器翻譯中譯英方面超越人類業餘譯者的時間提前了7年,並達到了比肩人類專業譯者的水平。

「這是一個歷史性的突破,因為語言一直是我們人類交流最重要的東西,尤其中國要走向世界,中翻英現在可以達到專業的水平,這是一個歷史性的突破。這對中國走向世界,對人工智慧的推進都有正面意義,非常鼓舞人心。」黃學東告訴澎湃新聞(www.thepaper.cn)。

據黃學東介紹,這個項目由來自微軟亞洲研究院和微軟雷德蒙研究院的三個研究組,進行了跨越中美時區、跨越研究領域的聯合創新。

自1954年開始,機器翻譯一直是人類想要攻堅的領域。無奈在過去的幾十年中,由於技術方法,計算力和訓練數據等原因,研究人員一直未能找到有效的突破口。直到進入21世紀,研究人員引入深度學習的神經網絡,構建了神經機器翻譯(Neural Machine Translation)才有了突破。

神經機器翻譯,簡要的說,就是對源語言的句子進行編碼,即轉化為計算機可以「理解」的形式,編碼的結果會形成很多隱含變量,每個隱含變量代表從句首到當前詞彙為止的語義信息。然後通過一個解碼的過程,一個詞、一個詞輸出譯文。

這一次微軟的突破可謂是既站在了巨人的肩膀上,又用到了自己的創新:微軟的機器翻譯系統不僅用了最新的神經網絡技術,還用了微軟自己研發的一些獨到的技術,做到了集大成者。

在微軟這次的創新中,微軟的研究團隊借鑑了人類在翻譯時的一些思維方式。第一個是對偶學習(Dual Learning)。這有點像人類在學習英語時,當把中文翻譯成英文後,通常還需要檢查,即將英文再翻譯回中文,看是否正確,做到翻譯的一致性。這樣做的目的是能在中翻英、英翻中的過程中做到聯合優化。微軟就將這一方法「教」給了機器。

第二個是推敲網絡(Deliberation Networks)。在中文詩詞裡「僧敲月下門」中的「敲」就是一個作者在寫詩時反覆推敲,將語言表達到極致的結果。在微軟的機器翻譯系統中,就借鑑了這樣的方式。機器翻譯完成翻譯後,為了讓其做的更好,研究人員使用推敲網絡讓機器不斷推敲,不斷修改,把翻譯完的結果再輸入,再全盤考慮,做到不斷優化。

第三個是一致性規範(Agreement Regularization)。一致性規範讓翻譯可以從左到右進行,也可以從右到左進行,最終讓兩個過程生成一致的翻譯結果。

黃學東解釋說,這一點就像人類在翻譯的過程中,我們通常會左看右看,兩邊都看順眼了,才覺得放心。

除此之外,此次機器翻譯系統還使用了聯合訓練(Joint Training),這個方法可以認為是從源語言到目標語言翻譯(Source to Target)的學習與從目標語言到源語言翻譯(Target to Source)的學習的結合。中英翻譯和英中翻譯都使用初始並行數據來訓練,在每次訓練的迭代過程中,中英翻譯系統將中文句子翻譯成英文句子,從而獲得新的句對,而該句對又可以反過來補充到英中翻譯系統的數據集中。同理,這個過程也可以反向進行。這樣雙向融合不僅使得兩個系統的訓練數據集大大增加,而且準確率也大幅提高。

值得一提的還有,微軟研究團隊這次還為整個翻譯研究找了雙語的語言顧問,對機器翻譯的結果進行評測。就人們像學習英語時,通常需要有專業的老師對我們的學習成果進行評測一樣,對於機器翻譯而言,專業老師給出的結果也非常重要。「機器翻譯其實相當於一題有多個答案,答案好壞跟老師的水準有關係,所以用機器自動評分很難評判,我們現在用專業的人員來評,就是要把好質量關。」黃學東說。

在上述幾個技術的加持下,微軟的研究團隊將原本設定為兩年的研究周期,提前一年完成了機器翻譯達到人類專業水平的研究成果。

三所不同大學的薰陶和近30年的堅持

黃學東加入微軟已經25年了,算上大學時期的研究,他在人工智慧領域裡已經堅持了30多年時間。從最初的默默無聞到最近幾年,自己帶領的團隊接二連三的完成突破,黃學東說這是堅持不懈的成果,也是自己的幸運。

黃學東祖籍湖南,在現場接受澎湃新聞採訪時,仍可以聽出他普通話裡的湘音。15歲時,他便參加了高考,考上了湖南大學計算機專業。回憶起自己的本科時光,黃學東說印象最深的是湖南大學嶽麓書院門前的對聯:「惟楚有才,於斯為盛」 。

「嶽麓書院有一千餘年歷史,同樣在嶽麓書院這個地址,湖南大學一直保持了教育的連續性。我每天從宿舍經過嶽麓書院,都要看嶽麓書院門前的對聯,它為自信心,有情懷的追求打下了基礎。因為很多事情,以及你在追求事業的過程中一定要有耐力,要有內力,這是湖南大學給我最好的訓練。」黃學東說。

湖南大學的本科學習結束後,黃學東北上來到了清華大學念碩士和博士。在清華,黃學東學習了5年時間,完成了碩士學業,但博士沒有讀完就「跑」了。原因是,當時在自己導師的鼓勵下,黃學東提前到了英國的愛丁堡大學學習。

但正是學習環境的改變,讓黃學東找到了自己想要研究的方向。

「30年前,我在清華學的都是美式英語,留學去了英國,而且去的是蘇格蘭的愛丁堡,儘管學校非常漂亮,也是出大牛的地方。可是上課,我聽不懂,因為我的英文不好,再加上蘇格蘭口音。所以我當時就想要是一邊講一邊有字幕多好。」黃學東笑著說,「當時英國還是很厲害的,1987年,BBC的所有電視節目都有字幕,我當時就調到蘇格蘭的當地頻道看字幕學蘇格蘭式英語,講的我現在英文都帶蘇格蘭口音。」

深切體會到自己學習過程中的痛點後,黃學東希望能幫助其他人也解決這個問題。他在微軟後來所做的許多工作和研究也跟這些經歷相關。例如,微軟的語音翻譯,它們擁有Skype translator、Microsoft translator兩個落地產品。目前,Microsoft translator不管是iPhone還是Android設備都可以使用,還和微軟Office整合起來了。這款應用可以在有語言障礙的面對面溝通時,同時支持100個人用60多種不同語言自由的交流。

堅持了30年後,黃學東說他的最終夢想是能讓機器理解人類的語言,並讓機器能夠像人一樣說話、交流。目前,他的團隊在語音識別、機器翻譯上已經取得成功,下一個目標是能在語音合成上取得突破。

中美人工智慧競爭格局

從中國的大學出發,黃學東在英國、美國都有過學習、工作的經歷。微軟作為全球科技巨頭,在人工智慧領域已經有了深入的布局。設在北京的微軟亞洲研究院,更是被外界稱為是人工智慧人才培養的「黃埔軍校」。

對於中美兩國之間,在人工智慧領域裡,越來越明顯的競爭火藥味,黃學東有自己的看法。

在他看來,人工智慧想要獲得成功,離不開三個要素:計算力、數據和算法。 從這三個維度出發,中國用戶量大、數據豐富,在數據上有優勢,這是中國一大亮點。但是僅有數據,沒有計算力和算法還遠遠不夠。

「目前,大的格局是這樣,從計算力來講,美國公司還是佔優勢,像英偉達的GPU,他們剛出的晶片很厲害,但中國目前還沒有。從算法來看,比如深度學習也是谷歌的TensorFlow、微軟的CNTK,這也是西方的工具。所以從計算力和算法來看,西方現在還是絕對佔優勢。中國的優勢是數據豐富,這三個裡面至少中國有一個優勢。」黃學東說。

在採訪最後,回顧自己25年的職業生涯,看到目前中國掀起的人工智慧浪潮,黃學東感慨頗多。對於當下想投身於人工智慧的青年研究人員,黃學東說最好的建議是堅韌不拔。

「不要動不動就想著一炮打紅,一夜成名,哪有那麼好的事。任何成績的獲得,不僅僅是個人的成果,是從好幾代人的研發基礎上一步步往前走的。這是事實,整個社區不是微軟一個公司,是大學研究機構和各個公司一起的努力才做到今天這個結果的。」黃學東說。

相關焦點

  • 人工智慧再下一城:機器翻譯提前7年達到人類專業翻譯水平
    由微軟亞洲研究院與雷德蒙研究院的研究人員組成的團隊今天宣布,其研發的機器翻譯系統在通用新聞報導的中譯英測試集上,達到了人類專業譯者水平。這是首個在新聞報導的翻譯質量和準確率上媲美人類專業譯者的翻譯系統。
  • 中到英新聞翻譯媲美人類,微軟機器翻譯新突破
    今日,微軟研究團隊表示,微軟和微軟亞研創造了首個在質量與準確率上匹配人類水平的中英新聞機器翻譯系統。黃學東告訴機器之心,他們採用專業人類標註與盲測評分代替 BLEU 分值而具有更高的準確性,且新系統相比於現存的機器翻譯系統有非常大的提升。因此,根據人類盲測評分,微軟機器翻譯取得了至少和專業翻譯人員相媲美的效果。
  • 微軟「中譯英」機器翻譯水平媲美人類
    微軟亞洲研究院宣布,微軟研究團隊研發的機器翻譯系統在通用新聞報導測試集 newstest2017 中 – 英測試集達到了可以與人工翻譯媲美的水平。這是首個在新聞報導的翻譯質量和準確率上可以比肩人工翻譯的翻譯系統。微軟亞洲研究院表示,機器翻譯是自然語言處理領域最具挑戰性的研究任務之一,這一系統模型包括由微軟亞洲研究院研發的對偶學習、推敲網絡、聯合訓練和一致性規範技術。
  • 微軟AI 翻譯重大突破:近人類語言中譯英
    微軟研究團隊發布消息,他們已經研發出首個可將中文翻譯成英文的人工智慧翻譯系統,該系統完成的中譯英文章與語句,具有與人類自然語言相一致的準確性和協調性。
  • 微軟宣布重大裡程碑:中英機器翻譯水平可「與人類媲美」
    PingWest品玩3月15日報導,根據微軟亞洲研究院消息,今天,微軟研究團隊宣布其研發的機器翻譯系統在通用新聞報導測試集newstest2017的中-英測試集上達到了人類水平,這是首個在新聞報導的翻譯質量和準確率上可以比肩人工翻譯的翻譯系統。
  • 微軟AI翻譯突破 中譯英已接近人類水平
    機器翻譯是幾十年來研究的重要課題,而且不少專家認為機器永遠無法做到像人一樣對話。但微軟的機器翻譯在上周打破了這一現狀,他們研發出了首個可以將中文翻譯成英文的人工智慧翻譯系統,而且表現的像人類一樣自然。
  • 微軟創CoQA挑戰新紀錄,最接近人類水平的NLP系統誕生
    近日,微軟語音與對話研究團隊在斯坦福機器對話式問答數據挑戰賽CoQA Challenge中奪冠,並且單模型和集成模型分別位列第二和第一,讓機器閱讀理解向著人類水平又靠近了一步。這也是繼語音識別、機器翻譯等成果之後,微軟取得的又一項好成績。
  • 巨頭扎堆的小市場:不學外語,機器翻譯搞定一切?
    另一方面,隨著智能翻譯的興起,越來越多語言專業的學生和翻譯行業的工作人士抱怨,神經網絡翻譯等技術的出現,讓原本就競爭激烈的翻譯市場迅速進入了冰凍期。但是,未來機器翻譯真的會完全取代人類,讓翻譯員們下崗嗎?網易智能梳理了目前主流的機器翻譯技術與應用,一探智能機器翻譯行業究竟。
  • AI看圖說話首超人類!微軟認知AI團隊提出視覺詞表預訓練超越...
    Azure AI 認知服務首席技術官黃學東解釋說,視覺詞表的預訓練類似於讓孩子們先用一本圖畫書來閱讀,這本圖畫書將單個單詞與圖像聯繫起來,比如一個蘋果的圖片下面有個單詞apple,一隻貓的圖片下面有個單詞cat。視覺詞表的預訓練本質上就是訓練系統完成這種動作記憶。目前,VIVO 在 nocaps 挑戰中取得了 SOTA效果,並首次超越人類表現。
  • 劉和平、韓林濤:下「機器翻譯替代人類」結論為時尚早
    這是全球首次在真實交際環境下測試機器同聲傳譯!150多名與會者見證了這一事件。一個星期後,我們拿到了為本次大會提供技術支持的Mark Seligman博士撰寫的的微軟機器翻譯應用報告初稿,鑑於技術保密等原因,我們這裡只從人工翻譯和機器翻譯對比的角度對此次人機比拼作出以下觀察思考。2018年3月15日camel AI科技評論消息稱,「機器翻譯新突破,微軟中英新聞翻譯達人類水平」。
  • 對話沈向洋:我曾熬了滿頭白髮 但微軟已成AI領頭羊
    在學術上,沈向洋是計算機視覺和圖形學研究的世界級專家,是美國電氣電子工程協會院士(IEEE Fellow)、國際計算機協會院士(ACM Fellow),曾任國際計算視覺期刊編委會成員。2017年2月,沈向洋當選美國工程院院士。談小冰:它是微軟三大AI產品線之一,下一步技術關鍵是對人的理解在近期舉辦的第五代微軟小冰發布會上,沈向洋到場助陣。
  • 沈向洋揮別微軟,但微軟人的中國故事沒有劇終
    沈向洋是微軟全球執行副總裁、微軟人工智慧及微軟研究事業部負責人。他的離職引發了國內科技圈的震動。沈向洋是最後一位蓋茨年代的高級副總裁,他的離職也標誌著微軟全球執行副總裁職位中將再無華人身影。接替沈向洋AI與研究工作的是微軟CTO Kevin Scott。
  • 媲美人類有何不可?深度解讀微軟新 AI 翻譯系統四大秘技
    《機器翻譯新突破,微軟中英新聞翻譯達人類水平》中,我們介紹了微軟亞洲研究院與雷德蒙研究院共同研發的新的機器翻譯系統,微軟稱它在 newstest2017 的中-英測試集上達到了與人工翻譯媲美的水平。雷鋒網 AI 科技評論下面根據論文,結合以往的相關研究詳細講講用在新翻譯系統中的這四大技術到底是怎麼回事,品味品味當這四項技術同時使用的時候,能夠達到人類水準到底能不能算是「合情合理」。文末我們也會貼出一些微軟提供的中文到英文翻譯結果,不知道能否徹底打消可能的疑惑。
  • 微軟提出新型通用神經機器翻譯方法,挑戰低資源語言翻譯問題
    近日微軟發布博客,提出一種半監督通用神經機器翻譯方法,解決低資源語言機器翻譯的問題,幫助解決方言和口語機器翻譯難題。該研究相關論文已被 NAACL 2018 接收。機器翻譯已經成為促進全球交流的重要組成部分。
  • 有道nmt神經網絡_有道神經網絡翻譯(nmt) - CSDN
    另一方面,隨著智能翻譯的興起,越來越多語言專業的學生和翻譯行業的工作人士抱怨,神經網絡翻譯等技術的出現,讓原本就競爭激烈的翻譯市場迅速進入了冰凍期。但是,未來機器翻譯真的會完全取代人類,讓翻譯員們下崗嗎?網易智能梳理了目前主流的機器翻譯技術與應用,一探智機器翻譯行業究竟。
  • 微軟語音 AI 技術與微軟聽聽文檔小程序實踐|AI ProCon 2019
    趙晟微軟語音AI的技術突破微軟在30多年前開辦微軟研究院時,已開始投入大量的人力物力在語音和語言上。近幾年來,微軟在語音識別上首先取得突破,在2016年,語音識別的準確度已達到跟人相似的水平。2018年,在中英機器翻譯上和人類做比較,發現機器翻譯的質量跟專業翻譯人員的結果完全可以相媲美。2018年9月,微軟首先發布了基於神經網絡的語音合成產品服務,它與人聲的自然度得分的比例達到98.6%,也就是說非常接近人聲。
  • 百度:目前機器翻譯準確率已經與人類水平相當
    IDC中國副總裁兼首席分析師武連峰表示,到2021年底,超過70%具有海外業務的中國企業將不同程度的採用機器翻譯,應用場景也將更為豐富。  據介紹,百度提出的語義單元驅動的AI同傳模型,翻譯準確率為80%,時間延遲約為3秒,與人類水平相當。  此外,百度方面還披露,百度翻譯可支持203語種互譯,現在每天響應超過千億字符的翻譯請求。
  • AI會話能力超越人類!CoQA挑戰賽微軟創新紀錄
    也就是說,人類與這個模型互動更像是與真人之間的交流。CoQA挑戰賽通過理解文本段落,並回答對話中出現的一系列相互關聯的問題,來衡量機器的性能。此次,微軟亞研院NLP團隊和微軟Redmond語音對話團隊聯手組成黃金搭檔參賽。在CoQA挑戰賽歷史上,他們是唯一一個在模型性能方面達到人類水平的團隊!
  • 翻譯行業的發展方向:機器翻譯VS人工翻譯
    近年來,機器翻譯技術有了很多新的突破,在實際的語言服務實踐中,機器翻譯有了很多成功的案例。機器翻譯必將深刻影響翻譯服務行業,將給人工翻譯帶來實際的威脅。另一方面,機器翻譯以其人工翻譯難以比擬的速度,將提高人類對於海量信息的處理能力,彌補人工翻譯在速度和成本方面的不足。不管你喜不喜歡,你都無法迴避機器翻譯的發展。如何利用機器翻譯技術成了翻譯服務行業的重要課題。
  • 重築巴別塔:機器翻譯的夢想與現實
    引言:技術的新進展使人們對機器翻譯的關注與熱望達到前所未有的高度。本報記者採訪一線專家,為你全面解讀關於機器翻譯的那些事兒:  宇宙翻譯器:究竟要多久才能出現?星際艦隊成員把它別在胸前,它能將所有的已知語言翻譯為聽者所懂的語言,對其餘的未知語言也可通過對簡短幾句話的分析而進行轉換。不過按照劇中的設定,這種宇宙翻譯器要到22世紀才能發明。  然而,微軟公司前不久的一項技術展示卻讓人們覺得似乎不需要等那麼久。