蘋果、Google、微軟、亞馬遜,哪家的語音助手會的語言最多,以及...

2020-12-12 愛範兒

蘋果、Google、微軟、亞馬遜,哪家的語音助手會的語言最多,以及為什麼?

2018 年 9 月,一家叫 Vocalize.ai 的人工智慧初創公司做了一項測試,它比較了 Google、蘋果和亞馬遜的智能語音助手,發現了一些有意思的事情。

比如,三家語音助手都能很好地識別美式口音和印度式口音的英語,但 Siri 和 Alexa 在識別中式口音時,準確度都大幅下降。

對語音助手來說,識別同一種語言的不同口音已經是個挑戰,而要「學會」一種新語言則更加困難。

比如,直到今年秋天,三星的 Bixby 才會增加對德語、法語、義大利語和西班牙語的支持,這些語音加起來有超過 6 億的使用者;微軟的 Cortana 用了很多年才支持西班牙語、法語和葡萄牙語。

在人工智慧取得重大突破並飛速發展的今天,為什麼語音助手的發展如此緩慢?人類要重建巴別塔,該如何努力呢?

為什麼語音助手支持一種新語音這麼難?

語音助手要「學會」一門語言主要有兩個大課題:聲音識別和聲音合成。

聲音識別又分成兩個部分,第一步是將語音轉成文字的語音識別,第二步是語義理解,涉及的技術主要是自然語言處理。

深度學習的突破是人工智慧在最近幾年飛躍發展的重要原因。目前,語音研究領域也主要使用深度神經網絡——一個像人類神經一樣的分層數學函數,可以不斷自我學習和進步。

這已經是一個巨大的進步。過去的自動語音處理技術(ASR)主要依賴手動調整的統計模型來計算短語中詞組合的概率,深度神經網絡不僅降低了錯誤率,而且在很大程度上避免了人為監督的需要。
但基礎的語言理解還遠遠不夠,本地化依然是個巨大的挑戰。有技術人員透露,目前,根據要涵蓋的意圖,新語言構建查詢理解模塊需要 30 到 90 天。如開頭所說,即使是識別同一種語言的口音,都是巨大的挑戰。

不同語言的差別更大。比如在語法層面,英語中形容詞通常出現在名詞前,而副詞既可以在前,也可以在後。對語音助手來說,這就很容易產生迷惑,比如「海星」(starfish)這個詞,語音轉文字的引擎很容易將「星星」(star)理解為「魚」(fish)的形容詞。

將語音處理為文字並加以理解後,語音助手還必須以人類的聲音來回復。

傳統的語音合成技術主要包括一個合成引擎和一個預先錄入的語音資料庫,合成引擎通過計算機軟體查找語音資料庫中匹配的讀音把文本轉化為語音。但是,這種「人造的語音」非常不連貫,聽上去也很不自然。為了覆蓋更多的詞,傳統的語音資料庫通常也非常大。

現在的語音合成技術被稱為 TTS(文本轉語音),它使用數學模型重新創建聲音,然後組合成單詞和句子。 最新的 TTS 同樣引入了深度學習,可以在「訓練」的過程中越來越強。

目前,相比語音識別和語義理解,語音合成的技術要成熟很多。中國各大網際網路公司也經常在運營活動中使用語音合成技術。

幾大語音助手分別支持哪些語言

Google Assistant

Google 的語音助手支持的語言最多,目前它在 80 個國家支持 30 種語言,包括:

  • 阿拉伯語(埃及,沙烏地阿拉伯)
  • 孟加拉語
  • 中文(繁體)
  • 丹麥語
  • 荷蘭語
  • 英語(澳大利亞,加拿大,印度,印度尼西亞,愛爾蘭,菲律賓,新加坡,泰國,英國,美國)
  • 法語(加拿大,法國)
  • 德語(奧地利,德國)
  • 古吉拉特語
  • 印地語
  • 印尼語
  • 卡納達語
  • 義大利語
  • 日語
  • 韓語
  • 馬來語
  • 馬拉地語
  • 挪威語
  • 波蘭語
  • 葡萄牙語(巴西)
  • 俄語
  • 西班牙語(阿根廷,智利,哥倫比亞,秘魯)
  • 瑞典語
  • 泰米爾語
  • 泰盧固語
  • 泰語
  • 土耳其語
  • 烏爾都語

蘋果的 Siri

2018 年被 Google Assistant 超過後,Siri 目前支持的語言數排第二名。包括 36 個國家的 21 種語言:

  • 阿拉伯語
  • 中文(普通話,上海話和廣東話)
  • 丹麥語
  • 荷蘭語
  • 英語
  • 芬蘭語
  • 法語
  • 德語
  • 希伯來語
  • 義大利語
  • 日語
  • 韓語
  • 馬來語
  • 挪威語
  • 葡萄牙語
  • 俄語
  • 西班牙語
  • 瑞典語
  • 泰語

微軟的 Cornata

  • 簡體中文
  • 英語(澳大利亞,加拿大,紐西蘭,印度,英國,美國)
  • 法語(加拿大,法國)
  • 德語
  • 義大利語
  • 日語
  • 葡萄牙語(巴西)
  • 西班牙語(墨西哥,西班牙

亞馬遜的 Alexa

  • 英語(澳大利亞,加拿大,印度,英國和美國)
  • 法語(加拿大,法國)
  • 德語
  • 日語(日本)
  • 西班牙語(墨西哥,西班牙)

三星的 Bixby

未來會如何發展?

在語音識別、語義理解和語音合成領域,它們取得進步的主要原因是引入深度學習。

未來,更加依賴機器學習可能對語音領域的研究有更大的幫助。

「處理多語言支持伴隨著不同的語法規則,這也是目前主要的挑戰之一,語音處理模型必須考慮並適應這些語法規則,」人工智慧公司 Clinc 的副總裁 Himi Khan 解釋到,「大多數自然語言處理模型採集句子,進行詞性標註——在某種意義上識別語法,並創建規則來確定如何解釋該語法。」

▲ 傳說中的巴別塔,因上帝將人類的語言打亂而中止建設. 圖片來自:jonathanpark

而未來,如果有了一個真正的神經網絡堆棧——一個不過多依賴語言庫、關鍵詞和詞典的系統,可以將關注語言改為研究詞的嵌入,以及嵌入後的連接模型。那麼,「它就可以應用在幾乎所有語言的語音識別上。」

這只是一個研究方向。但總體來說,使用海量的真實對話作為語料供機器學習,而不過多依賴人工定義的識別模型,可以有效地幫助語音助手更加「聰明」。

 

題圖來自:thewiredshopper

相關焦點

  • 語音助手Siri、Alexa、Google Home遭方言調戲,英語聽力哪家強?
    近年來,智能語音助手的迅速發展給人們的生活帶了諸多便利。隨著蘋果、谷歌、亞馬遜等網際網路巨頭相繼推出自己的語音識別助手,一場智能語音助手大戰拉開了帷幕。為了搶佔中國的語音助手市場,不久前蘋果語音團隊負責人Alex Acero表示:在iOS 10.3版本中,語音助手Siri將支持上海話。網友不禁調侃,Siri真是越來越「機智」了。
  • 谷歌助手精通30種語言智商碾壓各大競爭對手 語音助手學習語言有多...
    令人驚訝的是,谷歌助手、蘋果的Siri、亞馬遜的Alexa和微軟的Cortana只能識別出其中相對較小的一部分語言。直到今年秋天,三星的Bixby才獲得了德語、法語、義大利語和西班牙語的支持。全球共有6.16億人使用這些語言。Cortana花了好幾年時間才精通西班牙語、法語和葡萄牙語。那麼,為什麼創新的步伐如此緩慢呢?
  • 語音助手哪個好用點?五款好用的手機語音助手評測
    語音助手哪個好用點?   小編給大家評測一下最常用的五大語音助手,我們來看看蘋果/谷歌/微軟/三星/亞馬遜誰更厲害?   五款語音助手的共同點很多,比如都集成在作業系統中、可通過物理或是虛擬按鈕啟動。功能方面,都可以執行一些任務,如查詢天氣、新聞、搜索信息等等。
  • 小娜走了,微軟小冰又來了,語音助手到底有沒有用
    在微軟發布Cortana僅7個月之後,沒有手機平臺作為支撐的亞馬遜,發布Echo系列智能音箱。發售當年,Echo的出貨量就達到了250萬臺,2016年銷量更是翻倍,達到520萬臺。 語音助手的進化是靠海量的數據堆出來的,而微軟很長一段時間裡寄託的WP手機,在頂峰時的市場佔有率也不過只有區區3%。到最後跨平臺碰壁,醒悟過來的微軟終於發布了和曼哈卡頓聯合推出的智能音箱Invoke。這時候時間都已經來到了2017年,國外亞馬遜和谷歌的智能音箱已經佔了佔據了市場份額的半壁江山;國內天貓精靈、小米AI和百度等智能音箱也開始井噴式發展。
  • BBC與微軟合作推出Beeb語音助手 可理解不同的英國口音
    回到當下,BBC似乎又一次進軍技術領域,這一次是AI語音助手市場。 目前不少科技巨頭已推出其語音助手產品。雖然競爭者總是有存在的空間,但蘋果的Siri、亞馬遜的Alexa和谷歌的Assistant之間的分化可能已經讓消費者和與之捆綁的服務都接受不了。而BBC的Beeb使得消費者又多了一個選擇。
  • 亞馬遜借語音助手Alexa打翻身仗 開放性獲認可
    【環球科技綜合報導 記者 李宗澤】據英國《金融時報》2月3日報導,在推出智能語音助手Alexa之前,亞馬遜(Amazon)剛剛經歷了一次令人尷尬的失利。亞馬遜希望用智慧型手機Fire做出一番成績,但這一嘗試徹底失敗,迫使該公司在2014年末進行了一次1.7億美元的減記。
  • 亞馬遜正在更新其基於AI的語音助手系統
    打開APP 亞馬遜正在更新其基於AI的語音助手系統 網際網路分析沙龍 發表於 2020-12-13 09:57:27   首先,在2019年,Alexa能夠自動響應英語和其他語言的請求,但僅限於兩種語言。
  • 語音助手哪家強?華為「小藝」VS蘋果Siri,結局出人意料!
    (原標題:語音助手哪家強?華為「小藝」VS蘋果Siri,結局出人意料!) 近幾年隨著4G全面普及以及5G大幕拉起,加上移動網際網路與AI技術的興起,使得智慧型手機的交互方式變得更加多樣化。除了傳統的觸控式交互外,以華為和蘋果為代表的安卓陣營與iOS陣營,通過智能語音交互的形式,實現了交互邊界的延伸和拓展。
  • 三星Bixby語音助手應用商店在美、韓開設
    導讀:Bixby類似於亞馬遜的Alexa或蘋果的Siri,它是一種智能語音助手,允許用戶就幾乎任何事情提問。  據外媒報導,三星推出了專門的應用商店Bixby Marketplace,第三方開發者可以在這裡提供自己的Bixby應用程式,類似於亞馬遜的Alexa技能。
  • 微軟官方確認WP8.1語音助手將支持中文
    在 Windows Phone 8.1 的試用中,我們 已經給大家帶來了微軟語音助手 Cortana 的體驗報告。只是這裡有一個很大的障礙就是開發者版本中的 Cortana 語音助手僅支持美國地區的英語,我們需要事先把區域改成美國,語言改為美國英語,並重啟手機才行。 而且目前 Cortana 完全不支持中文,會把中文當成英文識別,以至於會把「廣州」識別成「Gun Show」。即便如此,Cortana 準確的識別率和快速反應能力還是給我們留下了非常良好的印象。
  • 微軟與BBC合作的項目 在英國開測Beeb語音助手
    英國廣播公司(BBC)與微軟合作推出了先前宣布的 Beeb 語音助手的早期版本,感興趣的朋友可註冊成為 Windows Insider 測試者並下載體驗 Beta 版本。 需要指出的是,目前這項服務僅在英國地區開啟有限測試。
  • 微軟小娜和亞馬遜的Alexa正式整合,智能語音市場的巨無霸誕生了
    一方面,微軟將與大疆共同開發Azure IoT Edge和AI服務,重點關注農業、建築、公共安全和其他基於無人機的案例。另一方面,高通則會創建運行在Auzre IoT Edge的視覺AI開發包,利用Azure機器學習和認知服務,以及高通的Vision智能平臺和AI引擎,來開發全新的解決方案。
  • 載著英式口音和笑話的BBC語音助手來了
    為了面向所有英國人提供更好的語音服務,2019年8月攜手微軟共同致力於小型語音助手產品研發。近日,BBC推出語音小助手Beeb首個Beta版,目前已進入PC端線上測試。該研發團隊稱, 利用微軟的Azure AI基礎架構,及相關技術和服務,Beeb目前已能夠精準識別十幾種地方口音。
  • 三星語音助手Bixby發布時間推遲 因英語語法把它「難住了」
    【TechWeb報導】6月1日消息,據國外媒體報導,知情人士稱,三星電子語音助手Bixby可能至少要到6月底才能在美國發布,比三星最新款高端智慧型手機的發布時間晚了兩個多月。
  • 「語音生活助手」哪家強?獵雲網評測告訴你答案
    因此,獵雲網對四款產品逐一進行了體驗,並對四款產品的自然語言理解能力(NLU)、對話管理能力(DM)、自然語言生成能力(NLG)進行了深度體驗,最終選取每個產品服務可用性最佳的場景進行橫向語義理解率測試。
  • 微軟展示最新語音翻譯機 支持中文等26種語言
    微軟上周日在微軟研究院科技節(TechFest 2012)上展示了最新開發的語音翻譯器。和其它翻譯器一樣,微軟研究院新開發的軟體允許用戶使用母語對其講話,然後使用揚聲器設備以另外一種語言輸出,比如西班牙語、法語、中文等。不過揚聲器輸出語言並不像電腦機器人替代聲音,而是近似於人類所發出聲音。
  • 科技大事件:蘋果語音助手Siri將登上Mac電腦
    蘋果語音助手Siri將登上Mac電腦  據悉,蘋果將在今年晚些時候推出OS X 10.12作業系統。屆時,語音助手軟體Siri將會出現在Mac電腦上。目前,Siri軟體是iPhone、Apple Watch和Apple TV作業系統的重要組成部分。從2012年起,蘋果就一直研究如何將Siri軟體整合到OS X作業系統中。據消息人士稱,蘋果的Mac電腦版Siri軟體擁有新的用戶界面,目前已準備就緒。蘋果有望在今年6月舉行的全球開發者大會上推出OS X 10.12作業系統。
  • 蘋果公司智能語音助手Siri配置方法
    siri是蘋果公司的智能語音助手,英文全稱是 Speech Interpretation & Recognition Interface,翻譯過來就是語音識別接口。可以在蘋果手機作業系統「設置」選項中的「Siri與搜索」對Siri進行設置。下面我們來看詳細的設置方法。
  • 谷歌在日推出「谷歌助手」日語版提供語音服務
    【環球科技報導 記者 馬麗】美國IT巨頭谷歌的日本子公司5月29日宣布,已開始提供對話型人工智慧(AI)服務「谷歌助手」的日語版,只要向智慧型手機發出語音,就能實現搜索、播放音樂和日程管理等功能。作為繼英語版之後的第二個語言版本,首先向使用「安卓」作業系統(OS)的智慧型手機依次提供服務。據共同社報導,語音操作被認為是普及網絡連接所有事物的「物聯網」(IoT)的關鍵,全世界的IT公司都在大力開發。日本國內的雅虎、都科摩也在著手研發,力爭趕超處於領先地位的美國亞馬遜等公司。對智慧型手機提出「下一項日程安排」或「交通狀況如何」等問題,谷歌助手便會以對話形式作出回答。
  • 宗寧:語音助手大作戰,人工智慧到底能做什麼?
    人工智慧的語音外殼在《變形金剛5》裡面,最完美的植入是什麼?實際上就是大黃蜂的聲音了。汽車人給他換了一個聲帶之後,它說了幾句話就把它憤怒的又拆掉了,因為她說話的聲音,是Siri的聲音。而Siri就是蘋果推出的人工智慧系統,你可以說它是語音控制系統,但實際上就是一個人工智慧。