圖片來源於網絡
上周末,有組微信「神翻譯」的截圖,在朋友圈、微博、虎撲等各大社交網絡上傳開。輸入「you play basketball like caixukun」,使用微信自帶的翻譯功能,得到的卻是完全錯誤的譯文。
圖片來源於網絡
一起被拿來戲弄的男星,還有吳亦凡、謝廣坤等。
圖片來源於網絡
蔡徐坤是目前中國娛樂界流量第一的明星,粉絲可不好惹。
圖片來源於網絡
微信目前已經下線「you are so」以及涉及「caixukun」等語句,現已無法翻成中文了。
圖片來源於網絡
「caixukun」之後,又有網友發現了更多會觸發bug的詞。比如,微信翻譯在大學英文簡稱上表現的很差勁,輸入"your school is WHU",翻不出武漢大學,卻給出了「你的學校很爛」的結果。
圖片來源於網絡
沒過多久,學校的句式也翻不出來了。
鬧出這些笑話的就是目前機器學習領域比較火的「神經機器翻譯」(NeuralMachineTranslation, 簡稱:NMT),由微信AI團自研。NMT的主要優點是它具有良好的長句(甚至段落)翻譯能力。問世後,NMT逐漸被微軟,谷歌,百度和騰訊等公司的翻譯產品所採用。對於短句,NMT就不一定那麼靈驗了——尤其是語句不通順的時候。
圖片來源於Unsplash
可能是「you play basketball like caixukun」這句話中,「caixukun」是個很奇怪的單詞。它既沒有出現在任何一本詞典當中,又跟上下文沒什麼關聯。
不過,未來可期。NMT技術會愈加成熟,說不定可以做到「信、達、雅」的高度。