重大突破!微軟宣布中英機器翻譯水平媲美人類 可應用於整個AI研究...

2020-12-11 前瞻網

一個由微軟研究人員組成的團隊周三表示,他們已經創建了第一個機器翻譯系統,可以將新聞文章的句子從中文翻譯成英文,並且具有與人相媲美的質量和準確性。

微軟亞洲和美國實驗室的研究人員表示,他們的系統在一套常用的新聞報導測試集上實現了達到了人類水平,測試集名為newstest2017。系統是由一群行業和學術合作夥伴開發的,去年秋天在WMT17研討會上發布。為確保結果既準確又符合人們的期望,團隊聘請了外部雙語人力評估人員,他們將微軟的結果與兩個獨立製作的人類參考翻譯進行了比較。

負責微軟演講,自然語言和機器翻譯工作的技術專家黃學東稱,這是最具挑戰性的自然語言處理任務之一的一個重要裡程碑。

「在機器翻譯任務中達到人的水平是我們所有人的夢想。」 黃學東說, 「我們沒有想到這麼快就能攻克它。」

黃學東同時領導最近在對話式語音識別任務中達到人類水平的團隊,表示翻譯的裡程碑特別令人欣慰,因為它可以幫助人們更好地理解對方。

「追求消除語言障礙來幫助人們更好地交流是非常棒的。」他說,「這非常非常有意義。」

機器翻譯是研究人員數十年來研究的問題,並且,專家說,在很多時候,許多人相信達到人類水平永遠無法實現。儘管如此,研究人員告誡說,這個裡程碑並不意味著機器翻譯是一個已經解決了的問題。

微軟亞洲研究院副總經理兼領導該項目的自然語言處理團隊負責人周明表示,該團隊很高興能夠實現數據集上達到人類水平的裡程碑。但他提醒說,未來還有很多挑戰,比如在實時新聞報導中測試系統。

微軟機器翻譯團隊的合作夥伴研究負責人Arul Menezes說,該團隊著手證明,當它使用中文和英文這樣的語言對時,它的系統可以表現得和一個人一樣出色,因為在一個包含普通有趣新聞故事常見詞彙的測試集上,中文和英文都有很多數據。

幫助領導該項目的Menezes說:「就數據和資源可用性而言,鑑於最佳情況,我們希望了解我們是否能夠真正達到專業人工翻譯的表現。」

Menezes說,研究團隊可以將他們為這一成就所取得的技術突破應用到微軟商用翻譯產品中,並應用於多種語言。這將為更精確,更自然的跨語言翻譯和詞彙更複雜或更小的文本鋪平道路。

對偶學習,推敲網絡,聯合訓練和一致性規範

儘管學術和行業研究人員多年來一直致力於翻譯工作,但他們最近通過使用稱為深度神經網絡的AI系統培訓方法取得了重大突破。這使得他們能夠創造更流利,聽起來更自然的翻譯,考慮到比以前的方法更廣泛的背景,即統計機器翻譯。

為了在這個數據集上達到人類水平的裡程碑,微軟北京和華盛頓州雷德蒙德的三個研究小組共同合作,增加了許多其他培訓方法,使系統更加流暢和準確。在許多情況下,這些新方法模仿人們如何反覆改進自己的工作,一遍又一遍地翻閱,直到他們做對。

微軟亞洲研究院副院長、機器學習組負責人劉鐵巖表示:「我們的大部分研究都受到人類工作方式的啟發。」他領導了一個負責該項目的機器學習團隊。

他們使用的一種方法是對偶學習。把這看作是對系統工作進行事實核查的一種方式:每次他們通過系統發送一個句子,將其從中文翻譯成英文時,研究團隊還將其翻譯成英文翻譯成中文。這與人們如何確保他們的自動翻譯是準確的相似,並且允許系統改進並從自己的錯誤中學習。由微軟研究團隊開發的對偶學習也可用於改進其他AI任務的結果。

另一種稱為推敲網絡的方法類似於人們通過一次又一次地編輯和修改他們自己文章的方式。研究人員教導該系統重複翻譯相同句子的過程,逐步完善和改進反應。

周明說,研究人員還開發了兩種新技術來提高翻譯的準確性。

一種稱為聯合訓練的技術被用於反覆推動英漢翻譯和中英翻譯系統。用這種方法,英漢翻譯系統將新的英文句子翻譯成中文,以獲得新的句子對。然後使用這些數據來增加訓練數據集,這些數據集的方向是相反的,從中文翻譯至英文。然後在另一個方向上應用相同的程序。當它們聯合時,兩個系統的性能都會提高。

另一種技術稱為一致性規範。使用這種方法,可以通過從左至右或從右至左讀取系統來生成翻譯。如果這兩種翻譯技術產生相同的翻譯結果,則認為結果比沒有得到相同結果更可靠。該方法用於鼓勵系統生成一致的翻譯。

周明說,他預計這些方法和技術對於改進其他語言和情況下的機器翻譯也很有用。他表示,除了翻譯,它們也可以用在製作其它的AI突破。

「這是機器翻譯研究可以應用於整個AI研究的領域。」他說。

沒有「正確」的答案

團隊用來達到人類水平裡程碑的測試集包括來自專業翻譯的在線報紙樣本中約2000個句子。

微軟對測試集進行了多輪評估,每次隨機挑選數百個翻譯進行評估。為了驗證微軟的機器翻譯與人類翻譯得一樣好,該公司超出了測試集的規格,並聘請了一群外部雙語語言顧問,將微軟的結果與人工生成的人工翻譯進行比較。

驗證結果的方法突出了教學系統準確翻譯的複雜性。通過語音識別等其他任務,可以非常直觀地判斷系統是否與人同樣出色,因為理想的結果對於人員和機器來說完全相同。研究人員稱這是一種模式識別任務。

隨著翻譯,有更多的細微差別。即使是兩位流利的人工翻譯員翻譯完全相同的句子也可能會略微不同,而且兩人都不會出錯。這是因為有多種「正確」的方式來表達同一個事物。

「機器翻譯比純粹的模式識別任務複雜得多。」周明說,「人們可以用不同的詞語來表達完全相同的東西,但是你不能說哪一個更好。」

研究人員表示,複雜性是機器翻譯最具挑戰性的問題,也是一個非常有意義的問題。

Liu說,沒有人知道機器翻譯系統是否能夠很好地翻譯任何語言對中的任何文本,以及翻譯人員的準確性和抒情性。但是,他說,這些最近的突破允許團隊繼續邁向實現這一目標的下一重大步驟,以及AI等其他重大成就,比如在言語—語音翻譯方面達到人類水平。

「我們可以預測的是,我們肯定會做得更好。」 劉鐵巖說。

本文來源前瞻網,轉載請註明來源。本文內容僅代表作者個人觀點,本站只提供參考並不構成任何投資及應用建議。(若存在內容、版權或其它問題,請聯繫:service@qianzhan.com) 品牌合作與廣告投放請聯繫:0755-33015062 或 hezuo@qianzhan.com

相關焦點

  • 微軟宣布重大裡程碑:中英機器翻譯可與人類媲美
    【環球網科技 記者 林迪】日前,環球網科技記者從微軟亞洲研究院官網了解到,其研究團隊對外宣布,最新研發的機器翻譯系統在通用新聞報導測試集newstest2017的中-英測試集上,達到了可與人工翻譯媲美的水平。
  • 微軟宣布!中英機器翻譯水平媲美人類
    IT之家3月14日消息 根據微軟亞洲研究院消息,今天,微軟研究團隊宣布其研發的機器翻譯系統在通用新聞報導測試集newstest2017的中-英測試集上達到了人類水平,這是首個在新聞報導的翻譯質量和準確率上可以比肩人工翻譯的翻譯系統。
  • 同聲翻譯要失業了!微軟剛剛宣布:中英機器翻譯可與人類媲美
    3月14日微軟亞洲研究院官網對外宣布,最新研發的機器翻譯系統在通用新聞報導測試集newstest2017的中-英測試集上,達到了可與人工翻譯媲美的水平。這是首個在新聞報導的翻譯質量和準確率上可以比肩人工翻譯的翻譯系統。
  • 又一裡程碑:微軟宣布中英機器翻譯達到人類水平
    【網易智能訊3月15日消息】昨天,由微軟亞洲研究院與雷德蒙研究院的研究人員組成的團隊宣布,其研發的機器翻譯系統在通用新聞報導測試集newstest2017的中-英測試集上,達到了可與人工翻譯媲美的水平,微軟稱這是首個在新聞報導的翻譯質量和準確率上可以比肩人工翻譯的翻譯系統。
  • 微軟宣布其中英機器翻譯水平可與人類相當
    網易科技訊3月14日消息,繼在語音識別和機器閱讀領域取得的「過人」成績,由微軟亞洲研究院與雷德蒙研究院的研究人員組成的團隊今天宣布,其研發的機器翻譯系統在通用新聞報導測試集newstest2017的中-英測試集上,達到了可與人工翻譯媲美的水平。這是首個在新聞報導的翻譯質量和準確率上可以比肩人工翻譯的翻譯系統。
  • 微軟人工智慧又一裡程碑:微軟中-英機器翻譯水平可「與人類媲美」
    繼在語音識別和機器閱讀領域取得的「過人」成績,由微軟亞洲研究院與雷德蒙研究院的研究人員組成的團隊今天宣布,其研發的機器翻譯系統在通用新聞報導測試集newstest2017的中-英測試集上,達到了可與人工翻譯媲美的水平。這是首個在新聞報導的翻譯質量和準確率上可以比肩人工翻譯的翻譯系統。
  • 機器翻譯新突破,微軟中英新聞翻譯達人類水平
    雷鋒網AI科技評論消息:14日晚,微軟亞洲研究院與雷德蒙研究院的研究人員宣布,其研發的機器翻譯系統在通用新聞報導測試集newstest2017的中-英測試集上,達到了可與人工翻譯媲美的水平;這是首個在新聞報導的翻譯質量和準確率上可以比肩人工翻譯的翻譯系統。
  • 微軟宣布重大裡程碑:中英機器翻譯水平可「與人類媲美」
    PingWest品玩3月15日報導,根據微軟亞洲研究院消息,今天,微軟研究團隊宣布其研發的機器翻譯系統在通用新聞報導測試集newstest2017的中-英測試集上達到了人類水平,這是首個在新聞報導的翻譯質量和準確率上可以比肩人工翻譯的翻譯系統。
  • 微軟機器翻譯新突破 中譯英水平可與人類相當
    繼在語音識別和機器閱讀領域取得的「過人」成績,由微軟亞洲研究院與雷德蒙研究院的研究人員組成的團隊今天宣布,其研發的機器翻譯系統在通用新聞報導測試集newstest2017的中-英測試集上,達到了可與人工翻譯媲美的水平。這是首個在新聞報導的翻譯質量和準確率上可以比肩人工翻譯的翻譯系統。
  • 微軟「中譯英」機器翻譯水平媲美人類
    微軟亞洲研究院宣布,微軟研究團隊研發的機器翻譯系統在通用新聞報導測試集 newstest2017 中 – 英測試集達到了可以與人工翻譯媲美的水平。這是首個在新聞報導的翻譯質量和準確率上可以比肩人工翻譯的翻譯系統。
  • 中到英新聞翻譯媲美人類,微軟機器翻譯新突破
    今日,微軟研究團隊表示,微軟和微軟亞研創造了首個在質量與準確率上匹配人類水平的中英新聞機器翻譯系統。黃學東告訴機器之心,他們採用專業人類標註與盲測評分代替 BLEU 分值而具有更高的準確性,且新系統相比於現存的機器翻譯系統有非常大的提升。
  • AI 裡程碑!機器翻譯系統提前7年達到人類專業翻譯水平
    由微軟亞洲研究院與雷德蒙研究院的研究人員組成的團隊今天宣布,其研發的機器翻譯系統在通用新聞報導的中譯英測試集上,達到了人類專業譯者水平。   「這既是技術上的突破,也是工程上的突破,是技術和工程的完美結合,只有把過程中的每一件事情都做好,才能得到這樣的結果。」   裡程碑式突破:首個媲美人類專業水平的機器翻譯系統   這次微軟的翻譯系統是在數據集 WMT-17 的新聞數據集 newstest2017 上取得了上述成果。
  • 微軟的裡程碑式突破:AI中翻英效果媲美人類
    摘要:微軟周三稱,研發出了首個媲美人類水平的中翻英系統。這一翻譯目前已經開放,也在一定程度上顯示出了相對更高的翻譯水平,但目前全世界的英翻中水平,似乎都仍有待提高……微軟周三稱,機器翻譯取得重要進展,研發出了首個媲美人類水平的中翻英系統。
  • 微軟AI翻譯取得突破進展:準確率可與人類翻譯媲美
    3月15日早間消息,一組微軟研究人員在3月14日發表博客文章稱,在利用深層神經網絡人工智慧(AI)訓練技術翻譯文本方面取得了進展。他們發明了第一臺機器翻譯系統,可以將中文新聞的句子翻譯成英文,準確率與人類不相上下。
  • 微軟智能翻譯技術新突破:機器翻譯提前7年達到人類專業翻譯水平
    由微軟亞洲研究院與雷德蒙研究院的研究人員組成的團隊四月宣布稱,其研發的機器翻譯系統在通用新聞報導的中譯英測試中,達到了人類專業譯者水平。這是首個在新聞報導的翻譯質量和準確率上媲美人類專業譯者的翻譯系統。
  • 人工智慧再下一城:機器翻譯提前7年達到人類專業翻譯水平
    由微軟亞洲研究院與雷德蒙研究院的研究人員組成的團隊今天宣布,其研發的機器翻譯系統在通用新聞報導的中譯英測試集上,達到了人類專業譯者水平。這是首個在新聞報導的翻譯質量和準確率上媲美人類專業譯者的翻譯系統。
  • 微軟AI 翻譯重大突破:近人類語言中譯英
    微軟研究團隊發布消息,他們已經研發出首個可將中文翻譯成英文的人工智慧翻譯系統,該系統完成的中譯英文章與語句,具有與人類自然語言相一致的準確性和協調性
  • 微軟技術院士黃學東:以人為師,機器翻譯達人類專業水平
    今年是黃學東加入微軟的第25年,但這位微軟老將至今仍活躍在人工智慧領域科學研究的前線。2018年3月份,他帶領的團隊在機器翻譯領域拿下一項裡程碑式的成就:其研發的機器翻譯系統在通用新聞報導的newstest2017中譯英測試集上,達到了人工翻譯水平。這是首個在新聞報導的翻譯質量和準確率上媲美人工翻譯的翻譯系統。
  • 消除語言障礙 微軟推出高質量中-英機器翻譯系統
    由微軟亞洲研究院與雷德蒙研究院的研究人員組成的團隊今天宣布,其研發的機器翻譯系統在通用新聞報導測試集newstest2017的中-英測試集上,達到了可與人工翻譯媲美的水平。這是首個在新聞報導的翻譯質量和準確率上可以比肩人工翻譯的翻譯系統。
  • 早報:微軟機器翻譯達人類水平 / 孫宏斌辭任樂視網董事長
    獵豹移動將於 3 月 21 日舉行發布會,發布一系列機器人產品此前,獵豹移動 CEO 傅盛宣布,將單獨成立機器人公司,初期投資約 5000 萬美金(約合 3.3 億人民幣),深入研究人工智慧領域。獵豹移動由原金山安全和可牛影像合併而成,除了獵豹清理大師、獵豹安全大使等工具類軟體,公司還推出豹米淨化器等硬體產品。