那個支持 AlphaGo 贏得圍棋比賽的深度神經網絡如今又要有新的表現,Google 即將把它應用於 Google 翻譯中,讓機器翻譯更加通順流暢,表意清晰。目前該系統僅應用於中文到英文的語言對翻譯。
Google 表示,新的翻譯系統簡稱為 Google 神經機器翻譯(Google Neural Machine Translation-GNMT),就某些語言而言,GNMT 錯誤率可以減少 60%。
人類翻譯、神經機器翻譯系統和短語單詞翻譯系統的完整度(分成 0~6 的程度)在不同語言應用中的對比
該項目的負責人之一,同時也是 Google 智庫成員的工程師 Mike Schuster 談到:
我們將按照 「端到端」 的模式對整個系統進行統一訓練,這可以使公司更專注於減少翻譯的錯誤率方面。雖然現在還並不完美,但的的確確是完善了很多。
新的神經機器翻譯系統如何檢測一個句子,並對它之間的關聯性和重要性進行考量
在機器翻譯方面,Google 使用的深度神經網絡叫做 LSTM(long short-term memory – 長期短期記憶)。LSTM 可以保留長期和短期的記憶,有點像人類的大腦,這使得它可以用更複雜的方式進行學習。
和 Google 以前的短語翻譯系統(Phrase-Based Machine Translation-PBMT)不同,LSTM 可以從頭到尾記住一句話再進行翻譯,使長句翻譯不再是單詞的拼湊,而是流暢通順的語言。
一句中文在短語單詞翻譯系統、神經機器翻譯系統和人類翻譯的區別
其實多年以來,Google 一直想讓 LSTM 服務於翻譯工作,然而一直無法攻克翻譯速度這個難題。直到做了大量的工程和算法工作,才得以完善這個模型,讓新神經機器翻譯系統能夠在跨越大型的 Internet 服務時保持工作速度。
Google 還計劃利用新系統推出 10000 多個語言對的機器翻譯。
以上圖片均來自:googleblog ,題圖來源:vertexreport