據外媒報導,谷歌於昨日發布了網頁版本和移動版本的谷歌翻譯。在漢譯英的過程中,谷歌翻譯會採用全新的神經機器翻譯機制,而這個App每天要進行一千八百萬次這樣的翻譯。此外,谷歌針對這個神經機器翻譯系統的運作原理,專門發表了一篇學術論文。
早前,谷歌就曾表示過,他們在谷歌翻譯中運用了神經網絡技術,但只限於實時視覺翻譯這個功能。前段時間,谷歌一名叫Jeff Dean的高級員工曾經告訴VentureBeat,谷歌已經在嘗試把越來越多的深度學習功能和機制融入到谷歌翻譯中。除此之外,谷歌的一位發言人在郵件中告訴VentureBeat,最新的神經機器翻譯是他們努力研發深度學習功能和機制的成果。
實際上,谷歌一直以來都在致力於將深度神經網絡融入它旗下越來越多的應用軟體中,其中包括Google Allo和Inbox by Gmail。這個功能可以幫助谷歌更加快捷、更加有效地處理它們獲取到的數據。
谷歌的神經機器翻譯(GNMT)對八層長的短時記憶遞歸神經網絡(LSTM-RNNs)的依賴性很強。「通過層間殘留聯繫可以加強梯度流。」谷歌的科學家在他們發表的學術論文中寫道。在圖像處理器的幫助下,神經網絡一旦變得足夠成熟,谷歌就可以依靠它尚未發布的張量處理單元進行數據處理。
雖然神經機器翻譯並不永遠是最佳之選,但是從谷歌的各種嘗試中我們不難發現,在某些情況下,神經機器翻譯還是有其過人之處的。
「人們對這個翻譯系統的評價顯示,與之前那個基於短語的翻譯系統相比,在翻譯多種語言時,神經學習翻譯系統的錯誤率已經降低了60%左右,其中包括英法互譯,英西互譯以及英漢互譯。附加實驗的結果顯示,翻譯系統的質量將和筆譯人員平均水準更加接近。」
在谷歌昨天發表的一篇博文中,Google Brain Team的研發科學家Quoc Le 和Mike Schuster提到,有了雙語評分員的幫助,在翻譯Wikipedia上的多語種樣句時,谷歌神經機器翻譯的錯誤率實際上已經降低了55%到85%。
儘管如此,這個系統還是不完美的。「神經機器翻譯還是會犯一些筆譯人員永遠都不可能犯的錯誤,比如遺漏了一些單詞、把一些常見的名字或是少見的專有名詞翻錯、對文章的語境缺乏整體把控等等。所以,我們還是有很大的進步空間。但不可否認的是,神經機器翻譯真的具有裡程碑意義。」
感興趣的讀者們可以猛戳谷歌論文原文和原博了解詳情哦。
via venturebeat
雷鋒網原創文章,未經授權禁止轉載。詳情見轉載須知。