「語音生活助手」哪家強?獵雲網評測告訴你答案

2020-12-16 和訊科技

【獵雲網(微信:ilieyun)北京】12月14日報導(文/小樹)

當點外賣、訂酒店、推薦餐廳、訂電影票都不用對著手機屏幕猶豫不決,動動嘴就可以解決所有的事情時,對於有選擇困難症的人來說,簡直是福音。

當然,前幾年,對著手機、智能音箱等硬體產品語音對話時,語義理解錯誤、對話困難、流暢性差等體驗讓很多人對於語音助手望而卻步。而現在,隨著以NLP語義理解為代表的語音技術日益發展,語音助手已經逐漸褪掉「智障」的稱號,開始真正走向智能。用語音對話處理生活上的問題,逐漸成為可能,甚至越來越多的人將語音助手看作是一種陪伴。

在小米MIDC開發者大會中公布了小愛同學的一則數據,截止今年6月,小愛同學MAU達到7840萬,累計喚醒次數達617億次。小米集團AIoT戰略委員會主席、IoT平臺部總經理範典談到「小愛同學的目標是成為擁有大規模落地場景的『智能生活助手』。」此外,華為、OPPO等國內大型手機與智能設備廠商也在多個場合表示語音助手將會是實現跨場景網際網路服務的重要方式。

從最開始的語音對話到現在的生活助手,語音交互不再簡單的作為生活中的點綴而出現,更多的以陪伴助手的角色出現在日常生活中。在未來,語音交互在生活服務場景中的使用將是大勢所趨。

生活服務不同於閒聊等服務場景,用戶在使用語音助手點外賣、訂酒店時,是帶有明確任務目的的。如何準確理解用戶意圖並幫助用戶完成點餐、訂票服務,這就要求語音助手必須要在生活服務領域擁有較高的意圖理解能力和具備面向任務型(Task-Oriented)的連續對話能力。基於以上前提,獵雲網找到了四款在生活服務場景中的「語音助手」較為突出的三款硬體產品和一款軟體應用,做了一次深度評測。

三款硬體產品包括蘋果手機、華為手機、小度音箱,另外一款軟體產品為曉悟APP。鑑於每一款產品在生活服務場景中所處優勢不同,且有些產品未開通相關功能。因此,獵雲網對四款產品逐一進行了體驗,並對四款產品的自然語言理解能力(NLU)、對話管理能力(DM)、自然語言生成能力(NLG)進行了深度體驗,最終選取每個產品服務可用性最佳的場景進行橫向語義理解率測試。

蘋果手機Siri:視覺交互依賴過高,不能體現語音交互特性

在四款產品中,獵雲網首先對蘋果手機Siri進行了測評,服務場景選擇了餐廳查詢場景。

「嘿,Siri,附近有什麼好吃的呀?」

「好的,希望這些信息對你有幫助。」

手機會以蘋果地圖為搜索基礎,屏幕會彈出附近四、五家餐廳,並顯示出距離。但和其他三款測試產品相比,Siri的多輪對話體驗感不好,每一次進行二次提問時,需按下Siri接口,在進行提問。如果再次用Siri語音喚醒,則默認重新進入新一輪對話,連貫性不好。

在餐廳選擇上,Siri可以直接下達距離、評分等要素排序的命令,但當獵雲網對著Siri發問「這個評分高麼?」「還有別的選擇麼?」「有沒有近一點的餐廳?」等問題時,Siri則無答應,也不會以「這個問題我沒聽清楚,請再說一遍。」這樣的安慰型話術收尾,語音對話結束的相對生硬,甚至會自動彈出以整句話為搜索關鍵詞進行搜索的界面。

「有沒有推薦的川菜」「我想擼串兒,有推薦的麼?」在類似餐廳類別的問題識別上,Siri還是可以準確定位出來並推薦給用戶。

「Siri,有沒有評分高的呷哺呷哺店。」

「好的,請過目」

「這些店哪個評分最高」

「我找到的評價最好的是北京市方莊芳古園一區18號樓4層的呷哺呷哺(方莊新城廣場店),評價為4.5星。」

諸如此類的對話下來,可以明顯的發現,Siri不會直接用語音說出除了餐廳名稱之外更多的詳細信息,需要用戶在視線不離開手機屏幕的前提下,和它完成對話。這一點相對於其他三款產品來說,語音交互的特性不能完全體現出來。

此外,Siri利用蘋果地圖作為信息檢索的入口,在餐廳的評分和評價上,和其他三款產品有所差別,沒有結合中國用戶特色進行本土化的定製化升級,體驗相對較差。

華為智慧助手:成熟的電影票語音預訂功能

獵雲網對於華為手機智慧語音助手「小藝」的測評,同樣選擇了小藝語音助手中用戶體驗度較好的電影票預訂作為測試場景。據悉,該語音訂電影票服務是由第三方智能語義理解與多輪對話服務提供商「玩秘」提供。

直接用語音對華為小藝說「電影票助手」喚醒服務。「你好,歡迎回來,你可以說,我想看赤狐書生。」小藝會用一句話開啟和用戶的溝通,這一點相對於其他產品來說,可以完美解決聊天開場的尷尬,直接帶用戶進入聊天模式。

在界面設計上,以白色為基底,下方分別排列著鍵盤接口按鍵、語音接口按鍵以及相機接口按鍵,簡單大方。和曉悟相同的是,小藝也保留著對話框以供用戶翻看記錄。

「最近有什麼好看的電影推薦?」

「最近《除暴》不錯,要去看嗎?」

「評分怎麼樣?」

「有8.5分」

「了解,那就去看除暴啦,你一般常去哪家電影院呀?」

「在公司附近看吧。」

和小藝對話,最明顯的特點是,它在回復的同時,還會拋出問句追問。不僅是簡單的對話,直接用商量的語氣在回應用戶,沉浸感十足。

除了評分之外,問到「金剛川的評價怎麼樣?」類似於評價的問題,小藝電影票助手會回答到「聽說金剛川鏡頭處理的高明,情緒有起有伏。要看這個麼?」

對於評價性的問題,小藝的電影票助手是獵雲網在這四款語音交互產品中體驗和可用性最佳的一款。

此外,在涉及到用戶地址隱私時,電影票助手會主動詢問用戶是否可以保存,獲得授權後才會保存地址信息,大大提升了用戶隱私的安全性。當用戶授權保存地址後,再次使用電影票助手購票時,小藝會直接問到,「今天想在家附近還是在公司附近看電影?」、「今天周六,要在家附近看電影麼?」這類的問題,更顯人性化。甚至於直接告訴小藝「去我經常去的電影院看電影」,小藝電影票助手都可以直接識別出來。

目前,電影類型、場次、票房、評分、評價等基本要素,小藝已經涵蓋到,並可以清晰的通過多輪對話顯現出來。

在電影票預訂生活服務場景上,相比於其他三款產品的體驗而言,小藝電影票助手(玩秘)的用戶體驗已經相對較好,各種對話場景已經覆蓋,多輪對話邏輯清晰,出現回答不上來或者邏輯混亂的次數相對較少。

曉悟APP:應對需求簡單的酒店預訂

第三款測評產品獵雲網選取了曉悟APP的酒店預訂作為測試場景。

打開曉悟APP,從界面設計上來看,黑色作為底色存在,用戶對話框以白色為主,曉悟對話框則以黃色為主,色調相對暗沉,但也簡單明了。

在簡單了解後,獵雲網開始了第一輪對話。直接發問「我想要訂個酒店」、「我要去上海出差,有什麼酒店可以推薦」等類似涉及到「訂酒店」的關鍵詞句後,曉悟都會回復「你想什麼時候入住?住幾天?」

「明天入住,下周一離開。」「推薦酒店為上海鳶尾花公寓(中路分店),1間舒適一室一廳套房,房間總價格為285.00元/一天,從2020年12月10日入住,2020年12月14日離開,地址位於上海市黃浦區上海黃浦區黃浦西藏中路200號大(中華小區來福士廣場對面)要訂這家酒店嗎?」

如果用戶再具體說到一個區域內,曉悟會再搜索後推薦區域內一家酒店。在最初的一輪對話中,曉悟基本上沒有什麼問題。但在對曉悟進行詢問,「這個是評分最高的嗎?」「這個酒店是幾星級?」「這個酒店有浴缸麼?」「這個酒店有停車場嗎?」等再一輪對話時,曉悟則回答為「曉悟還在幫您訂酒店呢,要麼您換個說法試試。」類似的話術,進一步深入了解酒店詳情則稍顯困難。

獵雲網以「幫我換一個更高級(價格更高)一點的」的問題開啟第二輪對話,曉悟則可以反應並選擇價格高一點的再次詢問。

但在酒店的分類上,曉悟對青年旅舍、民宿等酒店類型暫無分類功能;在房間分類上,曉悟已經可以識別大床房、雙床房等說法,但喚醒效果卻差強人意,在幾輪對話後,再次詢問時就會出現語義理解不清等問題。

總體來說,曉悟在服務簡單指令時有較為不錯的表現,但如果涉及到更多類似於酒店類型、酒店服務、房間選擇上,曉悟的體驗感就會直線降低。

小度音箱:生活服務場景停留在簡單對話上

最後,獵雲網在小度音箱上體驗了餐廳推薦場景。

當獵雲網在小度上詢問到「小度小度,附近有什麼好吃的餐廳推薦。」小度則會回答 「找到了好幾個好吃的餐廳,為您推薦漢田肅肅免麵館」。而屏幕下方則會出現引導詞「小度小度,第一個。」「小度小度,去這裡。」

當獵雲網再一次喚醒小度推薦餐廳時,就直接彈到了搜索界面。在生活服務場景下,小度音箱語義理解體驗感十分差。

當詢問到餐廳類別「小度小度,有沒有川菜館推薦?」小度音箱屏幕上則會直接播放出教你做川菜的視頻。

在評分、類別、評價等關鍵要素上,小度的體驗效果並不好。

結語:語音交互,各有所長,但生活服務場景是大勢所趨

獵雲網對這四款產品各選取了200句生活場景測試語料,測試結果顯示,華為手機「小藝」在預訂電影票場景下理解率達89%,曉悟在預訂酒店場景下理解率為31%,而蘋果Siri由於在生活場景上所開通的功能有限,因此,基於蘋果地圖信息上的餐廳預訂功能理解率為24%,小度同樣如此,在餐廳推薦場景的表現更為差強人意,理解率不足10%。

儘管獵雲網對不同產品選擇其相對成熟的場景進行測試,但從以上數據中可以很清晰的看出,華為手機在訂電影票場景的多輪對話語義理解力最為成熟,而曉悟APP在訂酒店場景下多輪對話語義理解力有待加強,而Siri和小度在生活服務場景的可用性較差。

值得注意的是,Siri和小度儘管在生活服務場景上體驗不好,但是小度音箱的優勢在於教育場景,甚至與以「兒童陪伴」為標籤而存在,童聲對話中講故事板塊、日常語音溝通等板塊相對成熟。

語音交互作為一種人機互動方式的重要補充,由於其輸入與查詢效率高、「可以想怎麼說就怎麼說」等特點,加入了語音交互的人機互動服務體驗顯著優於單一的觸控交互方式。越來越多的廠商開始意識到這一點,尤其是以華為為代表的國內主流手機廠商及智能終端廠商,紛紛開始提前布局語音交互,並將打造智能語音助手列為未來幾年的核心戰略之一。

當各大廠商都在通過自己的力量推動的語音交互發展時,作為語音交互中的藍海市場——生活服務場景,也將是各大廠商搶灘布局的領域。只有在技術不斷成熟穩定之後,用戶對話體驗感上升,語音交互才會逐漸成為「生活助手」,常伴用戶身邊,解決生活中的方方面面的問題。

(責任編輯:季麗亞 HN003)

相關焦點

  • 語音助手Siri、Alexa、Google Home遭方言調戲,英語聽力哪家強?
    近年來,智能語音助手的迅速發展給人們的生活帶了諸多便利。隨著蘋果、谷歌、亞馬遜等網際網路巨頭相繼推出自己的語音識別助手,一場智能語音助手大戰拉開了帷幕。為了搶佔中國的語音助手市場,不久前蘋果語音團隊負責人Alex Acero表示:在iOS 10.3版本中,語音助手Siri將支持上海話。網友不禁調侃,Siri真是越來越「機智」了。
  • 騰訊高級研究員柴華:《智能語音助手產品和服務的評測探索》
    文章整理自TiD2019質量競爭力大會  柴華(騰訊 高級研究員)  《智能語音助手產品和服務的評測探索》演講  TiD2019質量競爭力大會邀請到騰訊高級研究員柴華為參會者帶來《智能語音助手產品和服務的評測探索》的精彩演講。
  • 蘋果、Google、微軟、亞馬遜,哪家的語音助手會的語言最多,以及...
    蘋果、Google、微軟、亞馬遜,哪家的語音助手會的語言最多,以及為什麼?比如,三家語音助手都能很好地識別美式口音和印度式口音的英語,但 Siri 和 Alexa 在識別中式口音時,準確度都大幅下降。
  • 微軟和亞馬遜語音助手合併 求解決小娜這尷尬的發音
    電腦評測圈裡的媒體老師們在日常工作中往往最常常接觸的女聲就是Windows系統自帶的語音助手Cortana,每次打開到手的評測機,就會傳出小娜的聲音「你好,我是小娜。。。」。雖說是標準普通話的女聲,但是小娜機械般的發音在當下AI語音助手柔美自然的聲調中還是讓人覺得非常的不舒服。
  • 谷歌副總裁Scott Huffman:過度炒作正吞噬語音助手未來
    )】8月28日報導 (編譯:孫家樂)編者註:隨著人工智慧的發展,語音助手服務成為了人們生活的重要部分。但是現今的語音助手服務仍然存在不足,不論是過度炒作、語音識別難度大還是出現問題的最終責任人等問題,都影響著語音助手服務的發展。想要在這方面取得進展,必須反對「一刀切」,要有創新,也要聯合所有相關人士的智慧,一同解決難題,推進語音助手服務的發展。
  • 雙UI+vivoice語音助手 靚麗vivo S6評測
    功能特色: 1、Fun-Touch 雙UI系統(基於Android4.0) 2、Hi-Fi高保真音樂 3、800萬像素攝像頭 4、vivoice語音助手      這款手機內置服務中最有意思的莫過於vivoice語音助手了。這套服務和蘋果的Siri非常類似,但是對普通話的支持要好很多。第一次接觸vivo S6的用戶可能找不到開啟vivoice的方式,實際上只要長按Home鍵,這個語音助手就可以開啟。
  • 語音助手哪家強?四款手機比較:iPhone7年Siri,遠不如這些國產
    近年來,語音助手在各種手機中的地位越來越高了,無論是我們常用的蘋果還是國產手機,很多廠商對它的研發力度也在不斷增長。所以,今天我們就目前市面上常見的四款手機語音助手,住做一次全面的測評,到底誰與爭鋒,我們拭目以待。
  • 蘋果、Google、微軟、亞馬遜,哪家的語音助手會的語言最多?
    2018 年 9 月,一家叫 Vocalize.ai 的人工智慧初創公司做了一項測試,它比較了 Google、蘋果和亞馬遜的智能語音助手,發現了一些有意思的事情。比如,三家語音助手都能很好地識別美式口音和印度式口音的英語,但 Siri 和 Alexa 在識別中式口音時,準確度都大幅下降。
  • 語音翻譯哪家強? 三款手機輸入法橫比測評
    現在各家手機輸入法也都推出了語音翻譯功能,能夠在語音輸入過程中進行實時翻譯。近日,一位網友與外國帥哥微信聊天時對搜狗、訊飛和百度三款手機輸入法的語音翻譯功能進行了對比測試,通過對語法的正確性和語義表達的準確度來展現了各家翻譯功能的實際能力,究竟哪家翻譯功能比較強讓我們一起來看評測吧。
  • 不僅僅是搜索 語音助手生活化功能解讀
    1國產語音助手的自身特色    不知道說到語音助手大家都會有怎樣的印象。語音助手這東西最初讓我們留下深刻印象還要數蘋果推出的Siri,這個能跟你說話互動的iOS新特性在當時確實讓不少Android平臺的用戶頗感羨慕。
  • 【中興天機7評測】解放雙手不是難事 中興AXON天機語音體驗_中興...
    體感撥號 輕鬆抬手打電話  對於白領一族來說高效率辦事是第一準則,而通常在生活中普通的撥號首先需要找到聯繫人,當聯繫人多了挨個找吸取太過於繁瑣,通過語音助手中體感撥號就能瞬間解決這個煩惱。手機貼近耳朵喚醒撥號  在鎖屏或者待機界面,用戶只需要將手機貼近耳朵,語音助手便會通過傳感器識別到用戶打電話的姿勢,並詢問你需要打給誰,之後你要做的只是說出聯繫人的名字,聰明的語音助手就會自動將電話打到對方的手機上
  • 語音助手在線陪聊 誰能真正解決成為我的生活幫手?
    沒問題,語音助手在線陪聊!那麼我們就找來兩臺熱門旗艦機華為P30 Pro和iPhone XS Max對比試試,看看這兩款手機的語音助手,到底誰能解決我們小姐妹的生活小難題呢?第一回合:語音助手喚醒測試對比在使用前,語音助手需要先喚醒。日常使用中,姐妹們經常因音量較小無法喚醒語音助手,這次測試我們便先進行一次語音助手喚醒的測試。
  • 【中興天機7評測】解放雙手不是難事 中興AXON天機語音體驗(全文...
    【中關村在線】中興天機7評測:從誕生的那一天起,語音就是我們人與人之間最基本的交流之一,透過聲音了解對方情緒,對聽到的內容理解分析並給出對方反饋,雙方思維才能交互。同樣的語音交互已經被運用到了智慧型手機上,通過語音識別,可以打開想要的軟體,打電話,發簡訊,查詢天氣信息等,這些已經開始變得不需要我們動手了。
  • 調查報告:誰在使用語音助手?為什麼?
    語音助手已經成為許多人日常生活中的一部分。例如Siri,Cortana和Google智能助手。然而,當他們第一次出現時,並沒有太大的區別。 例如,當人們在他們的智慧型手機上嘗試使用像Siri和Cortana等工具時,發現它們沒有給他們帶來太多價值,這很大程度上是由於早期智能語音助手錯誤率太高,以及AI技術應用尚未成熟。
  • 首款中文語音智能手錶Ticwatch評測:大膽做加法-智能手錶,Ticwatch...
    今天要體驗和評測的主角就是有著「國內首款中文語音交互手錶」之稱的Ticwatch(官方指導視頻念作「『提克』watch」)。今年,Moto 360二代國行(評測)所搭載的語音系統就是來自出門問問的解決方案,團隊也於近日拿到了谷歌C輪融資7500萬美元。在展開評測文章之前,還是照例用幾個關鍵詞來概括這款智能手錶:圓形外觀、中文語音、功能全面(通話、三方應用、運動健康)、弧形側觸摸條、磁吸式無線充電。
  • OPPO小布助手2.0到來,升級 AI 性能,語音交互更智能
    在這萬物互聯的時代,人工智慧技術蓬勃發展,人機之間的智能交互愈發受到群眾的青睞,而語音助手更是成了這其中繞不開的話題。但是目前存在的語音助手,大部分並不十分「智能」,存在功能不多、語音識別不準、語音喚醒困難等種種問題,給用戶的體驗並不友好。
  • 亞馬遜Alexa語音助手是什麼?
    打開APP 亞馬遜Alexa語音助手是什麼?不過你或許會有疑問,Alexa是什麼?此次成為焦點只是一個偶然的事件嗎? 亞馬遜Alexa 要明白Alexa是什麼,首先要知道亞馬遜Echo。亞馬遜Echo可以作為智能家居的控制裝置,同時還是一款可攜式揚聲器,它的高度為10英寸,採用了圓柱形的設計,可以擺放在家中的任何位置,包括廚房。
  • 聊一聊語音交互以及語音助手
    關注並將「人人都是產品經理」設為星標每天早 07 : 45 按時送達隨著科技的不斷發展,如今語音助手也頻繁的出現在我們的日常生活中,比如手機的語音助手、智能音箱等等,語音助手的出現也很大程度上提高的一些效率問題;本文作者分享了關於語音交互的理解,我們一起來看一下。
  • 語音轉文字APP哪家好?教你一鍵錄音轉文字的方法
    語音轉文字哪家好?快速實現錄音轉文字的方法。這也許是大多數人對語記類APP的疑問所在,恰巧我對這方面有點研究,下面我就來為大家全面透徹的介紹語音轉文字的方式方法。錄音轉文字助手我之前就用的是【錄音轉文字助手】,整體使用過程還是非常滿意的。一款可將錄音迅速轉換成文字的工具,不管你是想要邊錄邊轉換,還是上傳之前的音頻再接著進行轉換都可以。在手機各大應用市場中均可找到,操作方法也很簡單。
  • vivo X23 全新Jovi人工助手,這個語音助手真的好用
    在眾多國產品牌裡,vivo在人工智慧方面的進步非常大,NEX系列推出的Jovi智能語音助手獲得了非常好的口碑。最近vivo 發布的最新的手機X23,其中Jovi智能語音助手得到了全面升級,人工智慧技術更加先進。vivo X23在人工智慧方面改變最大的一點可能就是,這款手機配備了一顆獨立的AI實體鍵。