一個由微軟研究人員組成的團隊周三表示,他們已經創建了第一個機器翻譯系統,可以將新聞文章的句子從中文翻譯成英文,並且具有與人相媲美的質量和準確性。
微軟亞洲和美國實驗室的研究人員表示,他們的系統在一套常用的新聞報導測試集上實現了達到了人類水平,測試集名為newstest2017。系統是由一群行業和學術合作夥伴開發的,去年秋天在WMT17研討會上發布。為確保結果既準確又符合人們的期望,團隊聘請了外部雙語人力評估人員,他們將微軟的結果與兩個獨立製作的人類參考翻譯進行了比較。
負責微軟演講,自然語言和機器翻譯工作的技術專家黃學東稱,這是最具挑戰性的自然語言處理任務之一的一個重要裡程碑。
「在機器翻譯任務中達到人的水平是我們所有人的夢想。」 黃學東說, 「我們沒有想到這麼快就能攻克它。」
黃學東同時領導最近在對話式語音識別任務中達到人類水平的團隊,表示翻譯的裡程碑特別令人欣慰,因為它可以幫助人們更好地理解對方。
「追求消除語言障礙來幫助人們更好地交流是非常棒的。」他說,「這非常非常有意義。」
機器翻譯是研究人員數十年來研究的問題,並且,專家說,在很多時候,許多人相信達到人類水平永遠無法實現。儘管如此,研究人員告誡說,這個裡程碑並不意味著機器翻譯是一個已經解決了的問題。
微軟亞洲研究院副總經理兼領導該項目的自然語言處理團隊負責人周明表示,該團隊很高興能夠實現數據集上達到人類水平的裡程碑。但他提醒說,未來還有很多挑戰,比如在實時新聞報導中測試系統。
微軟機器翻譯團隊的合作夥伴研究負責人Arul Menezes說,該團隊著手證明,當它使用中文和英文這樣的語言對時,它的系統可以表現得和一個人一樣出色,因為在一個包含普通有趣新聞故事常見詞彙的測試集上,中文和英文都有很多數據。
幫助領導該項目的Menezes說:「就數據和資源可用性而言,鑑於最佳情況,我們希望了解我們是否能夠真正達到專業人工翻譯的表現。」
Menezes說,研究團隊可以將他們為這一成就所取得的技術突破應用到微軟商用翻譯產品中,並應用於多種語言。這將為更精確,更自然的跨語言翻譯和詞彙更複雜或更小的文本鋪平道路。
對偶學習,推敲網絡,聯合訓練和一致性規範
儘管學術和行業研究人員多年來一直致力於翻譯工作,但他們最近通過使用稱為深度神經網絡的AI系統培訓方法取得了重大突破。這使得他們能夠創造更流利,聽起來更自然的翻譯,考慮到比以前的方法更廣泛的背景,即統計機器翻譯。
為了在這個數據集上達到人類水平的裡程碑,微軟北京和華盛頓州雷德蒙德的三個研究小組共同合作,增加了許多其他培訓方法,使系統更加流暢和準確。在許多情況下,這些新方法模仿人們如何反覆改進自己的工作,一遍又一遍地翻閱,直到他們做對。
微軟亞洲研究院副院長、機器學習組負責人劉鐵巖表示:「我們的大部分研究都受到人類工作方式的啟發。」他領導了一個負責該項目的機器學習團隊。
他們使用的一種方法是對偶學習。把這看作是對系統工作進行事實核查的一種方式:每次他們通過系統發送一個句子,將其從中文翻譯成英文時,研究團隊還將其翻譯成英文翻譯成中文。這與人們如何確保他們的自動翻譯是準確的相似,並且允許系統改進並從自己的錯誤中學習。由微軟研究團隊開發的對偶學習也可用於改進其他AI任務的結果。
另一種稱為推敲網絡的方法類似於人們通過一次又一次地編輯和修改他們自己文章的方式。研究人員教導該系統重複翻譯相同句子的過程,逐步完善和改進反應。
周明說,研究人員還開發了兩種新技術來提高翻譯的準確性。
一種稱為聯合訓練的技術被用於反覆推動英漢翻譯和中英翻譯系統。用這種方法,英漢翻譯系統將新的英文句子翻譯成中文,以獲得新的句子對。然後使用這些數據來增加訓練數據集,這些數據集的方向是相反的,從中文翻譯至英文。然後在另一個方向上應用相同的程序。當它們聯合時,兩個系統的性能都會提高。
另一種技術稱為一致性規範。使用這種方法,可以通過從左至右或從右至左讀取系統來生成翻譯。如果這兩種翻譯技術產生相同的翻譯結果,則認為結果比沒有得到相同結果更可靠。該方法用於鼓勵系統生成一致的翻譯。
周明說,他預計這些方法和技術對於改進其他語言和情況下的機器翻譯也很有用。他表示,除了翻譯,它們也可以用在製作其它的AI突破。
「這是機器翻譯研究可以應用於整個AI研究的領域。」他說。
沒有「正確」的答案
團隊用來達到人類水平裡程碑的測試集包括來自專業翻譯的在線報紙樣本中約2000個句子。
微軟對測試集進行了多輪評估,每次隨機挑選數百個翻譯進行評估。為了驗證微軟的機器翻譯與人類翻譯得一樣好,該公司超出了測試集的規格,並聘請了一群外部雙語語言顧問,將微軟的結果與人工生成的人工翻譯進行比較。
驗證結果的方法突出了教學系統準確翻譯的複雜性。通過語音識別等其他任務,可以非常直觀地判斷系統是否與人同樣出色,因為理想的結果對於人員和機器來說完全相同。研究人員稱這是一種模式識別任務。
隨著翻譯,有更多的細微差別。即使是兩位流利的人工翻譯員翻譯完全相同的句子也可能會略微不同,而且兩人都不會出錯。這是因為有多種「正確」的方式來表達同一個事物。
「機器翻譯比純粹的模式識別任務複雜得多。」周明說,「人們可以用不同的詞語來表達完全相同的東西,但是你不能說哪一個更好。」
研究人員表示,複雜性是機器翻譯最具挑戰性的問題,也是一個非常有意義的問題。
Liu說,沒有人知道機器翻譯系統是否能夠很好地翻譯任何語言對中的任何文本,以及翻譯人員的準確性和抒情性。但是,他說,這些最近的突破允許團隊繼續邁向實現這一目標的下一重大步驟,以及AI等其他重大成就,比如在言語—語音翻譯方面達到人類水平。
「我們可以預測的是,我們肯定會做得更好。」 劉鐵巖說。
本文來源前瞻網,轉載請註明來源。本文內容僅代表作者個人觀點,本站只提供參考並不構成任何投資及應用建議。(若存在內容、版權或其它問題,請聯繫:service@qianzhan.com) 品牌合作與廣告投放請聯繫:0755-33015062 或 hezuo@qianzhan.com