參考消息網12月2日報導 英媒稱,谷歌翻譯正在變得更加聰明。這一在線翻譯工具最近開始使用神經網絡進行幾種最常用語言之間的翻譯——而且該系統現在變得十分聰明,以至於能夠實現那些還沒有接受直接互譯訓練的語言對的互譯。為了做到這一點,谷歌翻譯似乎已經創造了一種自己的人工語言。
據英國《新科學家》周刊網站11月30日報導,傳統的機器翻譯系統把句子拆分為單詞和短語,然後分別加以翻譯。今年9月,谷歌翻譯公布了一個利用神經網絡一次性對整句句子下功夫的新系統,使系統得到更多語境來計算出最佳的譯法。這一系統目前在用於處理谷歌翻譯提供服務的8組最常用的語言對之間的互譯。
儘管神經機器翻譯系統正在迅速普及,但多數系統只能處理一組語言對,因此需要不同的系統來進行其他語言之間的翻譯。不過,在稍作修補之後,谷歌對其系統進行了擴展,從而能夠處理多組語言對——並且還能在尚未接受過直接互譯訓練的情況下進行兩種語言之間的互譯。
例如,如果該神經網絡已經接受了英語與日語、英語與韓語之間的互譯,它也可以進行日語與韓語之間的互譯,而無需先藉助英語作為中介。這種能力或許會使谷歌可以很快提升該系統,使之進行大量語言之間的互譯。
紐約大學的曹京賢(音)說:「這是一個巨大的進步。」他的團隊和德國卡爾斯魯厄理工學院的另一個團隊各自獨立地發表了致力研究可以處理多種語言組合的神經翻譯系統的相似論文。
谷歌的研究人員認為,他們的系統所以取得這一突破,是因為發現了一個共性,即不管在什麼語言中,具有相同含義的句子都是以相似的方式進行轉述的——他們稱這是一個「中間語言」的例子。在某種意義上,這意味著谷歌創造了一種新的常用語言,儘管這是一種專用於處理翻譯任務、無法讓人類閱讀或使用的語言。
曹京賢稱,這種名為「零樣本翻譯」的方法表現得仍然沒有更簡單的藉助中間語言的方法那麼出色。但是這一領域正在迅速取得進步,谷歌的研究結果將吸引研究界和產業界的關注。曹京賢說:「我毫不懷疑不久的將來我們將能夠訓練出一種能處理100種以上語言的神經機器翻譯系統。」
谷歌翻譯目前支持103種語言,每天翻譯超過1400億個單詞。
那麼,翻譯人員很快會淪為失業嗎?技術企業蒂爾德公司正在開發拉脫維亞語或愛沙尼亞語與英語之間的神經翻譯功能。該公司聯合創始人安德烈斯·瓦西列夫斯稱,神經翻譯技術對於簡單的文本已經進行出色的翻譯。但是優秀的翻譯人員除了理解源文本的含義外,還能理解其文體和詞法特徵,並能利用這種知識給出更為準確的翻譯。瓦西列夫斯說:「為了匹敵人類的這種能力,我們除了讓計算機獲得有關特定翻譯領域的知識外,還得找到一種辦法讓計算機學習一些有關世界的基本知識,以及如何利用這些知識詮釋需要翻譯的文本。」(編譯/曹衛國)