最近,微信的翻譯功能鬧了個笑話,它把圈內一位頂級流量明星的名字翻譯成了「傻蛋」,還把另一位當紅小生的名字改成了形容詞「可愛」。憤怒的粉絲們直接把#微信翻譯是認真的嗎?#這個話題頂上了微博熱搜。
像微信翻譯這類人工智慧(AI)翻譯產品到底靠不靠譜?在翻譯方言和專有名詞時,「翻車」機率大不大?昨天,快報記者作了個測評。
翻譯機翻譯軟體
基本只認標準普通話
杭州學院路的頤高數碼廣場2樓有售賣人工智慧翻譯機的攤位,攤位老闆娘介紹,售價499元的飛利浦人工智慧翻譯機可以支持中英文雙譯。「只要你說的普通話和對方說的英語發音都標準,翻譯出來沒問題的。」
在老闆娘的指導下,記者先在手機裡下載了和機器配套使用的軟體,在軟體上綁定了設備後,記者長按機器上的「ME」按鈕進行語音錄入,在發音過程中,App上也隨即出現了語音的中文文字版和英文翻譯版。
當記者用標準的普通話進行文字錄入時,可以看到,App上出現的對應文字和記者所說的幾乎不差。不過,當記者長按「YOU」按鈕,並讓對面的老闆娘也試下時,老闆娘用杭州普通話說,「你下好了嗎?」App上顯示的文字卻是「你想玩了嗎?」對應的英文翻譯也變成了「Do you want to play?」
「我是杭州人,平常在家裡不太說普通話的。」老闆娘也實話實說,「它只能支持中英文翻譯,你說漢語時,得儘量用標準普通話來說。」
東北話「槓槓的」
翻譯機翻成了「穩固的」
除了支持中英文雙譯,目前,市面上還有哪些人工智慧翻譯機能支持多國語言互譯?
在城西銀泰奇客巴士店裡,售貨員小姐向記者展示了一臺標價為2999元的科大訊飛2.0版翻譯機。
和記者先前體驗的那款沒有液晶屏幕的飛利浦翻譯機不同,科大訊飛的這臺翻譯機不僅機身很像一臺手機,可以聯網,還能支持泰語、德語、尼泊爾語在內的50多種小語種的中文翻譯。
不需要額外下載配套軟體,直接點擊機器下方按鈕後,機身的屏幕上就可以自動顯示語音文字。在點擊需要翻譯的語種後,中文文字下方會自動出現對應的語言翻譯。
這款翻譯機可以識別出方言嗎?帶著這個想法,記者錄了句東北話「槓槓的」(意思是:很厲害),觸屏選擇中英文互譯選項後,屏幕上隨即出現了「This thing is really stable 」,再把這句英語翻譯成中文的意思是「這個東西真的很穩定。」與「槓槓的」要表達的意思相去甚遠。
專有名詞對這款號稱翻譯準確率能達到95%的翻譯機也造成了困擾。
「浙江傳媒學院」在翻譯機上的英文翻譯結果是「Zhejiang media college」,不過,記者在該學校官網上看到的學校英文校名卻是「Communication University of Zhejiang」。
在記者測評的飛利浦翻譯機上,同樣也出現了這個問題。比如,「了不起的麥瑟爾夫人」被翻譯成了「Great Mrs.Machel」(偉大的梅切爾夫人),而不是原版的「The Marvelous Mrs. Maisel」。
流量明星的名字
是翻譯軟體的坑
「我不經常出國,感覺用手機上免費下的有道翻譯軟體就足夠了。」春節期間剛去英國玩了一圈的阿蔣,英語口語並不流利,不過,基本可以看懂日常英文的他,靠著蹩腳的口語和有道翻譯軟體,還是一個人在英國玩了7天。
比起需要花錢去買的硬體翻譯機,在手機上就能免費下載的翻譯軟體效果如何?
在有道翻譯官軟體上,記者輸入「我想吃四川缽缽雞和麻辣燙火鍋」,英文翻譯的結果是:「I'd like to have sichuan bobo chicken and spicy hot pot」。不過,記者在專門的英文詞典上查閱後發現,缽缽雞對應的翻譯是「Pot chicken」。
距#微信翻譯是認真的嗎?#話題登上微博熱搜已經過去了3天,和硬體翻譯機和有道翻譯軟體相比,這次引起飯圈「眾怒」的微信翻譯,現在還好嗎?
記者昨天在微信上輸入「you like caixukun」(你喜歡蔡徐坤),點擊翻譯後,並沒有出現中文譯文,而仍然是英文原文。輸入「you and Kris Wu look the same」(你和吳亦凡看起來很像),也沒有中文譯文,仍舊是英文原文。在有道上同樣輸入「you like caixukun」後,中文英文則是:你喜歡caixukun。
不過,當輸入的「you like Jackie Chan」,點擊翻譯後,則出現了對應的「你喜歡成龍」的中文譯文。
記者手記
智能翻譯產品
還差一個資料庫
現在很多科技巨頭都有自家的AI翻譯軟體產品。隨著全球各方面交流的加大,有人預計今年全球機器翻譯市場將達到69億美元。但是AI翻譯產品想要達到專業的翻譯水平,還有很長的路要走。
首先是語音識別能力還需要提高,特別是對方言和不標準的普通話的識別能力;
其次,專業翻譯的標準是達到「信、達、雅」,AI智能翻譯要克服人類口語化的難題,如語音斷句、語法差異等。
AI翻譯的準確程度實際上取決於數據。目前的翻譯體系中多是來自官方的文檔,缺少娛樂、體育方面的數據。加上各地口語中隨意性較大並存在網絡用語,所以AI翻譯仍需龐大的詞彙庫加以支撐。