網易科技訊11月25日消息 據外媒(Gadgets)報導,人工智慧技術近年來突飛猛進,微軟等矽谷巨頭甚至宣稱其語音識別系統已經能媲美人類。現在谷歌的AI在語言理解能力上更上一層樓,不僅可以通過更好的唇語識別來幫助聽力障礙人士,多語言神經機器翻譯(Multilingual Neural Machine Translation)也將顯著提高翻譯質量。
谷歌母公司Alphabet下屬的DeepMind部門和牛津大學的研究者使用新聞視頻對其AI系統進行訓練。用於訓練的視頻總長超過5000小時,語句超過118,000句。視頻取材自BBC電視臺自2010年至2015年間播出的節目。訓練完畢後,研究人員使用該系統對今年3月~9月間播出的口語節目進行測試。測試結果發現,系統通過「觀看」說話者嘴部動作便可以準確識別出整個句子。比如「我們知道這裡也會有數百位記者」。(We know there will be hundreds of journalists here as well)
給予相同的視頻素材,專業的唇語識別專家能夠達到12.4%的正確率。而AI系統識別正確率是46.8%。
前不久谷歌開始在「谷歌翻譯」中運用神經機器翻譯技術,能夠識別準確地識別句子而不再僅僅是單詞翻譯。現在谷歌宣稱使用多語言神經機器翻譯技術後,谷歌翻譯的翻譯效果將再上一層樓。
谷歌在博客中稱:「我們提出的結構無需改變基本的GNMT系統,而是在開頭使用一個額外的『token』來指定所需的目標語言翻譯。」除了能夠提高翻譯質量,新的方法還支持「Zero-Shot Translation」,即在沒有已知數據的情況下,能夠對沒有見過的語言進行翻譯。
雖然這些研究成果產生實際影響還有待時日,但不得不說這些技術創舉讓人十分印象深刻。
本文來源:網易科技報導 責任編輯: 張彬彬_NT5025