蘋果Siri翻譯究竟出了啥Bug? ​牛和「牛」傻傻分不清楚-虎嗅網

2020-12-16 虎嗅APP


作為蘋果設備的一款標配智能語音助手,Siri除了會講笑話,還會B-box,教你撩妹,卻也常常語出驚人。「調戲」Siri已經成為用戶日常。


近日,Siri卻因為翻譯功能Bug背上「侮X」的名號。從機器翻譯的技術角度來看,這事蘋果多少有些「委屈」。


事出有因。


昨日,細心網友發現iPhone在涉及「華為牛bi」、「小米牛bi」等關鍵詞翻譯至英文時,會出現侮辱性詞彙「bitch」;但翻譯「蘋果牛bi」關鍵詞句時卻能顯示正確英文結果。


在iPhone、iPad上使用Siri語音助手均會出現近似翻譯結果,結果對比明顯且復現率高,很快這個消息在社交媒體上炸開了鍋。


截止發稿前,蘋果Siri的翻譯功能已經部分從伺服器端取消涉及「牛bi」的詞條。直接詢問「……英文怎麼說」將反饋「這已經超出我的能力範圍」,但在調出翻譯功能界面後,仍能進行相關翻譯結果呈現。


不少網友和自媒體將其解讀為「侮X」的意圖,但從機器翻譯和機器學習的技術角度來看,這個帽子扣得有點「委屈」。


1. 傻傻分不清楚



為了進一步驗證Siri的翻譯功能Bug,我們進行了多輪測試,參考今日早上9點到10點時間段的測試結果。


目前,蘋果Siri已經停止部分翻譯功能,直接詢問Siri「……英文怎麼說」時,系統將反饋「已經超出我的能力範圍」,但在調出翻譯功能後,仍能看到相關翻譯結果呈現。


翻譯結果1:



翻譯結果2:



翻譯結果3:



翻譯結果4:



這裡,小米直接翻譯成「Mimi」,實在令人費解。


可以看到在多輪翻譯測試中,Siri對於「牛bi」的理解和翻譯結果很不穩定,有將「牛bi」翻譯成了「bitch」、也有翻譯成「so good」、「awesome」、「bullish」,顯然後者翻譯更為貼切中文中「牛X」的含義。


但是,以上翻譯結果還不至於將Siri翻譯結果套用「陰謀論」,說不通的地方在於——見過罵自己CEO的手機嗎?




稍微改變中文語法,翻譯結果又恢復了正常。



在中文,「牛bi」也被寫作牛B,多指「厲害」、「強」的意思,有時會簡稱為「牛」。


在維基百科中,「Bitch」作為名詞共有11種意思,均涉及包含粗俗、冒犯、進攻性質的負面詞彙含義,唯一第九種是中性含義,指代紙牌遊戲中的黑桃皇后。


為什麼Siri能翻譯出「bitch」這種字眼?


很大程度在於,Siri在面對不能理解的句型語法時將採取直譯方式。這個時候,中文語句中的「bi」就成了主系表句型中的表語。對此,我們同樣進行了測試驗證。



將翻譯有問題的句子去掉中文中的「bi」,比如「華為真牛」,Siri通常會翻譯成「XXX is a real cow」、「 is a real ox」。這也側面論證了Siri翻譯背後所採用的「看見不懂就直譯」的路徑存在。


2. 機器翻譯背後的技術解密


2011年10月,Siri隨著iPhone 4S的發布問世,成為iPhone設備的標配功能,如今AI語音助手也已經成為智慧型手機上的標配。


就目前技術發展階段來看,手機語音助手交互原理在於,設備根據採集的關鍵詞,來觸發底層回答的指令。伺服器端有編輯好的相應關鍵字和詞條,當用戶通過手機等設備發問時,算法搜索最為相關詞條並呈現答案,可能為一個或多個。翻譯問答的交互方式同理。


雖然在模型的訓練階段,已經出現神經機器翻譯等更人工智慧化的理解方式,但在推理階段,AI語音助手尚不能達到完全理解人類「語言」的水平。


具體來看看機器翻譯技術本身。


機器翻譯,又稱自動翻譯,簡言之即是藉機器之力自動地將一種自然語言文本翻譯成另一種自然語言文本。


採用機器做翻譯的思想最早由Warren Weaver於1949年提出。大半個世紀以來,機器翻譯技術先後了 基於規則的機器翻譯、統計機器翻譯、神經機器翻譯三次重要的方法演化。


神經機器翻譯,Neural Machine Translation,簡稱NMT,於2014年開始興起,逐漸應用卷積神經網絡,遞歸神經網絡,注意力機制等技術。


神經機器翻譯的優勢在於長句子、甚至段落的翻譯能力,閱讀起來上下文連貫程度接近人翻。目前,神經機器翻譯已經成為機器學習技術領域的主流。


2016年開始,神經機器翻譯已基本全面取代傳統的統計機器翻譯,Google、微軟、百度、搜狗等已相繼上線神經機器翻譯系統。


在英文中,單詞在一個語境下通常只代表一個意思;而在中文裡,一個字放在主、謂、定等不同的位置和語境中,代表的意思就有很多可能性,這也是中文博大精深之所在。



在本文開頭描述的情況中,Siri因為根本沒有理解關鍵詞的意思,所以採用了直譯,即通過拆分成「單字」的模式尋找匹配詞條,「牛」直接翻譯成ox、cow。不得不說,已經八歲的Siri對於中文語法的理解仍然處於比較「低端」水平。


當然,在中英翻譯上栽跟頭的又何止Siri這種「外來客」。前段時間,微信自帶的文字翻譯功能也是十分任性。



以及再一次掀起清華北大之爭的「神翻譯」。



隨後,微信團隊便部分下線了翻譯功能。騰訊微信團隊微在微博上回應稱,翻譯引擎在翻譯一些沒有進行過訓練的非正式英文詞彙時出現誤翻,導致部分語句翻譯出現問題。


這也充分說明了基於人工智慧的技術手段,在算法和模型足夠領先之外,語料,尤其是平行語料的訓練仍是高質量翻譯的核心。


所謂,「平行語料「即指的是源語音與目標語言一一對應的關係,比如,「I love you」=「我愛你」。而在微信的案例中,很有可能就是爬取並採用了網上已經存在的大量「caixukun=好」、 「caixukun=傻蛋」的語料。  


對於Siri等「外來客」而言,中英互譯效果不盡如意的很一大部分原因在於,我國用戶對其調用率和使用率不高,本土化語料的訓練量不夠大,所以在面對一些本土化的東西,顯得有些「智障」。這也就能解釋前文提到的例子,由於對美國之外的品牌不夠熟悉,Siri將「小米」 翻譯成「Mimi」。


「主要是訓練數據的覆蓋,如果覆蓋不好就要針對特定用語進行修正。」Facebook前機器翻譯專家向機器之心表示,「Siri出現的這個情況應該不是有意的,很可能是他們現有的模型對於『牛bi』都翻譯不好,但對於『蘋果』和其有關的說法做了bad case修復」。


一般來說,訓練語料主要來自三個方面,一是各種英漢辭典標準化語庫來源;二是網際網路上的爬蟲抓取,從全網大量的數據裡,抓取到所需要的高質量平行語料。


第三,則是各家公司能夠「各取所需」的優勢渠道,比如騰訊有大量基於微信平臺有大量社交的語料,阿里巴巴有大量基於電商平臺有大量交易的語料,或者其他公司通過付費購買特定場景語料。


那麼新的問題來了,Siri在中國市場的翻譯功能,會是誰提供的語料和API呢?


相關焦點

  • 蘋果Siri神翻譯:小米、高通是「bitch」
    燃財經消息 6月24日,有網友發現,蘋果智能語音助手Siri在涉及到競爭對手小米、高通、華為時,會出現有貶低意味的「神翻譯」。燃財經進行了如下測試:「嗨,Siri,蘋果真牛x,用英語怎麼說?」「嗨,Siri,小米真牛x,用英語怎麼說?」「Mimi is a bitch.」「嗨,Siri,華為真牛x,用英語怎麼說?」「Huawei is a real bitch.」
  • 蘋果Siri被爆侮辱性翻譯 華為和小米等被譯為bitch
    經測,喚醒Siri後,向siri提問:華為牛逼用英語怎麼說,Siri將其翻譯成Huawei,you bitch!再次提問:iPhone牛逼用英語怎麼說?Siri的回答則是:iPhone,Nikman。此外,燃財經也發消息稱,蘋果智能語音助手Siri在涉及到競爭對手小米、高通、華為時,會出現有貶低意味的「神翻譯」。「嗨,Siri,小米真牛x,用英語怎麼說?」「Mimi is a bitch.」「嗨,Siri,華為真牛x,用英語怎麼說?」
  • 蘋果的「人工智障」Siri辱罵國產手機?翻譯算法惹的禍
    日前,#蘋果siri被曝侮辱性翻譯 的話題成功登上微博熱榜。aiAedncaiAednc起因是有網友嘗試用 Siri 翻譯「華為真牛X」,翻譯出來的結果竟是侮辱性詞彙。而用 Siri 翻譯「蘋果真牛x」 卻出現了截然不同的回覆。
  • 蘋果Siri被爆侮辱性翻譯!華為、小米、高通被譯為「bitch」
    鞭牛士6月24日消息,據獵雲網消息,蘋果Siri被爆存在侮辱性翻譯。經測,喚醒Siri後,向siri提問:華為牛逼用英語怎麼說,Siri將其翻譯成Huawei,you bitch!再次提問:iPhone牛逼用英語怎麼說?
  • siri翻譯帶「色彩」,中文博大精深,豈能是siri能理解的
    導讀:蘋果手機自此2009年被聯通引進國內市場後,就一發不可實施,蘋果手機從iphone4一直火到了現在,目前蘋果手機也是大家使用下來好感相對較多的一個品牌。而siri是蘋果手機的一大特點之一了。而說起來蘋果手機的siri,大家都熟悉,甚至siri還一直被大家調侃,可以說蘋果手機是真正意義上第一款使用這個語音控制的手機,從當初的iphone4代開始,蘋果手機就使用了siri,那個時候國產手機大多都沒有這項功能,其實siri就是一個半AI智能,它會聽取你的指令操作手機,但是並不是所有指令都可以執行,只是大部分常用的操作。
  • iPhone Siri翻譯「華為真牛逼」為「Huawei is a real bitch」?
    最近小編了解到,蘋果Siri機器人翻譯又爆出大新聞!根據部分網友測試,打開siri以後,進行翻譯時出現了出人意料的結果!該網友向Siri發問:華為牛逼用英語怎麼說?沒想到蘋果給出的結果是:Huawei,you bitch!當網友進行下一個翻譯的時候:iPhone牛逼用英語怎麼說?
  • 蘋果siri出現侮辱華為的翻譯,是故意還是BUG?網友:小肚雞腸
    在最近幾日,我們在網上看到了很多關於iPhone之中的語音助手siri的一些有意思的翻譯,根據網友的爆料我們可以看得出來使用siri翻譯功能的時候,當翻譯「華為牛逼」這四個字的時候結果給出的英文翻譯居然是「HUawei is a real bitch」本來以為是翻譯功能出現了問題,
  • Siri被問「蘋果牛X用英語怎麼說」 Siri表示自己立場明確
    【CNMO新聞】想必即使不用iPhone的人也知道,Siri是Apple開發的一款智能語音助手,是市面上每一款iPhone的標準配置,作為一款智能語音助手,Siri用途廣泛,除了會講笑話,會B-box,會教你撩妹之外,也經常語出驚人,有些回答甚至讓人哭笑不得。今天,我們為Siri同學準備了這幾個問題,看看它的答案會是什麼。
  • Siri「開玩笑」?是蘋果不懂中文還是中國人不懂「碧池」?
    Siri是蘋果的智能語音助手,隨著Siri的出現,在國產手機當中才出現了小艾同學,小V同學等等一些其他的語音助手,最近就有朋友在使用Siri的過程當中開始詢問Siri華為牛逼用英語怎麼說?在看到Siri對於華為牛逼的英語翻譯之後讓很多人大失所望,siri將華為牛逼翻譯成英語是Huawei,you bitch!
  • 蘋果Siri現侮辱性翻譯?侮辱性翻譯如何觸發
    [PConline資訊] 作為蘋果設備的一款標配智能語音助手,Siri除了會講笑話,還會B-box,教你撩妹,卻也常常語出驚人。「調戲」Siri已經成為用戶日常。  截止發稿前,蘋果Siri的翻譯功能已經部分從伺服器端取消涉及「牛bi」的詞條。直接詢問「……英文怎麼說」將反饋「這已經超出我的能力範圍」,但在調出翻譯功能界面後,仍能進行相關翻譯結果呈現。  不少網友和自媒體將其解讀為「侮X」的意圖,但從機器翻譯和機器學習的技術角度來看,這個帽子扣得有點「委屈」。
  • 這6對水果長得很像,傻傻分不清楚,全部能認出來算你牛!
    在現在生活中,我們真是非常幸福,能吃到很多美味之外,水果也很豐富,國內的和進口的水果,應有盡有,在我們吃的水果裡面,有很多水果都長得很像,跟雙胞胎一樣,真是傻傻分不清楚,今天給大家盤點一下,這6對水果長得很像,傻傻分不清楚,全部能認出來算你牛!
  • 蘋果Siri出現神翻譯?這可能是個誤會
    然而這兩天,不少網友反饋,自己用的蘋果手機似乎「出了么蛾子」,幾個翻譯都出現了「疑似侮辱」翻譯的答案。今日一大早,筆者試著蘋果Siri的翻譯功能已經部分從伺服器端取消涉及「牛。。」的詞條。直接詢問「……英文怎麼說」將反饋「這已經超出我的能力範圍」,但在調出翻譯功能界面後,仍能進行相關翻譯結果呈現。
  • Siri出現的侮辱性翻譯,蘋果有意為之?不要被誤導了!
    其中就有華為,我們知道美國在這段時間可是處處針對華為的,在這個風口浪尖上,Siri還出現這樣的問題,不被引起關注才怪呢,具體怎麼罵的呢?我們來看一下圖片。我們知道,「牛逼」這個詞彙在中國算是一個褒義詞,反正不可能是一個貶義詞,但是Siri怎麼翻譯的呢?
  • 全球最貴和牛店開到中國來了,這個頂級食材有啥故事?
    除了加工食品和酒之外,和牛已經超過蘋果,成為日本第一大出口農產品。在中國,你也可以吃到那塊著名的神戶牛排三明治(Kobe Shabu)了。日本和牛肉質好,名聲在外。日本 4 種改良牛(黑牛、棕牛、短角牛和五角牛),其牛肉呈現清晰的大理石紋路。以肉中的非飽和脂肪含量為準的話,其含量遠高於多數其他牛肉,製作出的牛排鮮嫩肥美,入口即化。
  • 蘋果Siri差異性翻譯,涉嫌對華為爆粗口,網友:蘋果太壞了
    文:唐俟很長一段時間,siri作為蘋果的人工智慧語音助理,在中國呼聲很高,因為它是非常聰明的,不僅可以幫助我們更好地使用iPhone,還能帶來很多樂趣,而且siri因為十分淘氣說出了很多經典語句而上了熱搜。
  • 點火鍋時,牛百葉、牛肚、毛肚傻傻分不清!到底有什麼區別?
    點火鍋時,最不擔心的就是菜品多樣,相比於普通飯菜,能夠吃到更多的新鮮花樣,如菌菇類、綠葉菜、蛋類、海產品,還有很多吃貨們少不了的動物內臟。
  • 蘋果iOS14的翻譯,太牛逼了!
    原標題:蘋果iOS14的翻譯,太牛逼了!自從蘋果更新了IOS14之後,就不斷有網友發現,這翻譯功能屬於老司機級別!還很本土化,連方言都能整的明明白白。相比之下,谷歌翻譯就像是一個老實人。各種方言式髒話,蘋果翻譯不僅把意思都翻譯出來,還十分有髒話的靈魂!表面的詞能翻譯出來就算了,連這句話背後的含義都能看出來,這系統怕不是學了讀心術吧。翻譯本土名詞也是不在話下。甚至一些比較長的難句也基本準確。
  • 蘋果Siri被爆侮辱性翻譯 瘋起來連自己老闆都罵了
    最近網友發現蘋果智能語音助手Siri存在「侮辱性翻譯」。當向蘋果siri提問「華為牛逼用英語怎麼說」,Siri將其翻譯成「Huawei,you bitch」。當把主語換成小米時,也是同樣的翻譯:Mimi is a bitch。
  • 東南西北中大學,傻傻分不清,究竟誰最牛?
    近日,寒流來襲,中北大學因為「我們和北大就差一陣風」上了熱搜榜,本文整理相關資訊並分析西北大學、中北大學、東北大學、西南大學、中南大學和東南大學,東南西北中,哪所大學最牛?寒冬將至,前幾天東北地區寒流來襲,風也特別的大!小編在就在北方,感受特別深!但是大風帶來的不只是降溫,還把一所高校送上熱搜!
  • 什麼是和牛?原來日本國產牛不等於和牛,你分得清楚嗎
    日本和牛日本街頭最多的牛肉料理店就是烤肉店了,每年烤肉店的消費業績都讓人震撼,不過烤肉店的招牌上都會寫著「國產牛」,很多人都以為這就是日本和牛了吧,因為大家心裡都清楚,和牛也是日本的國產牛日本和牛日本對牛的稱呼有很多種,根據其銷售地來命名,因其分為兩大類,國產和外國產,國產還分乳牛,和肉牛。肉牛又分雜交牛、和牛。