隨著智能音箱的迅速發展,大家對智能語音產品的需求也變得越來越多,本文給大家詳解語音互動設計的全流程,一起來看看~
隨著智能音箱的迅速發展,谷歌(Google Home)、亞馬遜(echo)天貓精靈、小愛音箱……智能產品的井噴式增長,人們對智能語音產品的需求也越來越多,也越來越高,智能音箱對人們的生活的影響也越來越深,自然孕育而生一些新的職業需求,比如:VUI(語音互動設計師Voice User Interfaces Designer),語音體驗設計師VUE(Voice User Experience Designer),但其實VUI和VUE的分界線是很模糊的,這裡不做多敘述。
國際的一些大公司已經做了很好的示範了,比如:亞馬遜,谷歌等等,都會有設立專門的職位,做一些專門的研究,當然近期國內的相關招聘也會看到有相關的職位,且薪資不低。那麼接下來會個大家詳細的分享VUI(語音互動設計師Voice User Interfaces)。
20世紀50年代,貝爾實驗室建立了一個單人語音數字系統;
20世紀90年代,誕生了第一個可行的非特定人的語音識別系統。
交互式語音應答IVR系統的出現,代表了VUI的以一個重要時期。
也就是我們現在所處的的時期。
我們的現狀,我們正處於下一階段的初期階段,我們手機已經可以用語音處理很多事情了,但是還有很多事情是無法處通過語音完成的。
(1)優勢
(2)局限性
從項目的發布階段到發布階段都扮演著非常重要的角色。
當然很多人看到上面5條可能會有點怵,其實也並不是需要全部都需要會,也可以專門負責其中的一個鏈條、節點,比如:用戶研究、數據分析……
定義:簡單來說就是我問你答
目前我們使用的智能設備基本只能支持單輪對話,但這樣並不是人們習慣的對話方式。一輪以上的對話,才是符合用戶心理預期的。
請大家回憶下自己使用智能音箱的一些場景體驗,舉個例子(天貓精靈):
你會發現,智能音箱這個時候像是失憶了一般,毫無反應,顯然這並不是我們想要的一個交互。從用戶社交屬性來說,人們溝通的方式一直都是一輪以上對話式的,並不是單輪式的。一般來說,我們要做到讓用戶決定對話要持續多久,很顯然,你有親身體驗過的話,能做到多輪對話的比較少。
插一個題外話,最近天貓精靈更新了遊戲語音的玩法,算是踏進一步了吧,雖然不是很棒的體驗,但起碼跨進了多一步,相信未來會越來越棒的。那對話式是如何設計出來呢?大致是怎麼樣的一個流程呢?
這裡說的設計工具並不是說是一個具體的工具,更多是指一個方法論。
示例對話:
雖然是語音交互,但是還是離不開GUI的,它可以結合示例對話,將用戶體驗可視化。示例對話和原型組成了我們產品的故事板,GUI+VUI是用戶一套完整的體驗,所以,VUI和GUI在早期階段就開始合作,這樣對用戶體驗會更加流暢。
也叫做呼叫流程圖,一般來說我們的流程圖需要包括用戶使用中所有可能存在的分支,但這樣下來會有千萬條複雜的情況,流程圖就會很亂,也很難梳理,所以我們採用分組的方法。
具體的分類的方法可以根據分成多組(日曆功能、搜索功能,電話……),也可以根據不同的目的進行分組。
流程圖的使用到的工具就非常多了,這裡就不一一列舉了。
那大概我們設計完成了一組示例對話之後,我們就要對一些細節進行細緻的研究,比如:確認。
最重要的是用戶語音的確認,分為顯性確認和隱形確認。
1.1 那麼如何去判定什麼時候用隱性確認和顯性確認呢?
那麼下面就要介紹一下三級置信度。
系統將在一定的閥值內作出明確的形式確認信息,而這個閥值我們設定為三個等級。
1.2 置信度?
就是智能音箱能識別到聲音的清晰度。
用易懂的話說就是人與人之間溝通的語言接受的清晰度,當然聽不清對方說什麼話的時候時候一般會發起詢問,或者直接說,對不起,我沒有聽清,你可以再說一遍嗎?
1.3 三級置信度
比如:幫我再買一份外賣。
智能語音音箱能夠非常清晰的識別到你說的內容的時候,可以直接用隱形確認,這樣帶來的體驗流暢感舒服很多。
比如說,燈光花幾秒才能,那麼只是讓系統先恢復好了或者知道的來讓用戶知道後面發生什麼。還有加一些特定的音效,來代表特定某一個意思。
就是說智能語音音箱不會單獨的回答你是和否,會主動會詢問您一些的問候,通過這樣情感化的一些設計,將能夠讓用戶感到更加的溫暖和舒服。
那我們前面講到了那麼多的一些確認策略,那我們接下來再說一下對話式的標識,因為是讓用戶了解交談進展以及進展情況的重要方式。
它包括了以下三個方面:
那對話式對話作用是什麼呢?是讓用戶了解交談進展以及進展情況的重要方式。能夠更好的追蹤到用戶的使用過程中的一種路徑方法。
大家會發現我們很多時候智能語音設備並不是每次都能夠快速,精準接受識別我們的信息的。出錯率相對來說是比較高的,下面大概說下語音識別的出現錯誤異常的幾種情況。
錯誤異常的幾種情況:
未檢測到語音有大概兩種情況:一是用戶說了,系統沒有接收到;二是用戶沒說。
主要說下用戶說了,系統沒有接收到的情況,建議採取兩種解決方式:
1.1 那什麼情況下使用詢問呢?
1.2 什麼情況下更適合使用什麼也不做呢?
處理方式和未檢測到語音基本是一直的,這裡就帶過了。
出現這種情況的原因一般是兩點:
解決方法:這裡我們就要通過測試來發現具體是哪個環節出了問題了,通過數據的收集分析能夠找到具體的答案。
大概就是這樣的場景,天貓精靈,嗯……我想……嗯,好的,為您帶來一首XXX的歌曲。
解決方法:這個還是需要技術的介入,可以通過使用N-Best列表(可以通過這個列表規避二次錯誤)和鎮適用固件後相應的數據分析來構建此問題的解決方法。
說完了錯誤異常處理以及解決方式,我們接下來說下延遲和消除歧義。
在交互一般用戶等待的時間是7秒(現在可能是5秒),當你詢問等待回答的時間超過這個閾值,用戶就會懷疑是不是系統出問題了,甚至煩躁。
解決方法:一是通過「請稍等」讓用戶知道你在運作和查找;二是非語言提示,比如:音效等等。
很多時候用戶提供的信息只有一部分,再加上中文的多層含義的特殊性,消除歧義對用戶體驗的的提升有重要作用。
比如:問地名的天氣,中國很多鎮區的地名都是一樣的。
鼓樓:
解決方法:還是可以採用置信度的方式去判別,如果很確定就直接回答,要麼就多輪詢問確定。
最後的模塊說下幫助功能,也是至關重要的,能夠在一定程度上消除用戶的「恐慌」。所以,在我們VUI中設計對應的幫助是非常有必要的,比如:詢問智能語音設備你能幹什麼呢?它會告訴你他能做些什麼?比如:我的設備怎麼樣連結你的藍牙。APP:好的,長按……
和視覺界面交互其實是差不多的,用戶是非常不願意花很多時間達到他想要完成的任務的。越高效,越短時間,用戶的體驗會更加愉悅。
只需要告訴用戶主要關鍵信息即可,不要過於冗餘。舉個簡單的例子:購物APP的商品表現形式,一般都是把名稱和價格放在主要的位置,把詳情放進下一級頁面。採用儘可能簡短的表現形式,讓用戶直接獲取到他想要的,當然這對用戶的了解和洞察都要需要經驗的積累和感知的
舉個例子,用戶:明天的天氣怎麼樣?
APP:明天XXX地方的天氣19℃,小雨,適合穿…….
用戶可能只是想知道天氣而已,這時候我們是需要做到可以被用戶打斷,而不是「執拗」的把話說完,如果一直說下去,不允許用戶打斷,用戶的請求沒有被回應,這時候用戶會產生反感心理。
這是目前很多智能語音設備體驗上沒有那麼好的地方,也就是前面說的,可以進行多輪對話,當然如果要設定多輪對話,中間的交互情況將會比現在更佳龐大,需要考慮的可能性也會更佳複雜。
語音互動設計的前半部分設計流程基本已經概述完了,主要說了VUI的起源,一些VUI中用到的一些方法論,設計工具,一些異常情況的處理,和VUI設計的幾點原則。下面將會和大家聊下用戶測試和預發布、確認發布……
語音用戶界面的測試其實和視覺界面測試的方法有一些相同的地方,但也有一些差異。
一般來說,在開始測試之前呢,還是需要做用戶調研的,大概分為以下幾個步驟:
做用戶研究和訪談之前,我們要先搞清楚,這個利益方的需求是什麼,業務需求,用戶訴求是什麼,我們的產品能夠給用戶帶來什麼?能夠給他們解決什麼問題?最後我們要確定我們的目標用戶,然後進行訪談和調研。(大體的方法,詳細可以去看一下阿里提出的五導家加方法論)
2.1 給目標用戶制定,任務流程
就是給每一個受訪的用戶,一個特定的任務流程,但很多時候我們並不是只是測試一個任務,會有很多任務,那就會涉及到任務排序的問題。還有最好的方法是採用拉丁方陣設計,這樣的話不必通過出現所有可能的排斥方式來試驗。
那麼設定好這次任務之後呢,我們就要進行招募受試人員了。
2.2 招募受試人員
需要注意以下幾點:
對於小公司招募測試用戶可能會相對比較困難,成本相對來說會比較高,當然是可以招募你身邊的朋友和公司的同事來協助你的,但最好避開項目的直接核心人員。
那麼在目前人員完成之後呢,我們大概會進行一些進行中的一些測試,比如說:我們做一些提問。
請問這裡會涉及到一個方法,我們在互動設計裡面叫它為用戶體驗地圖。
我會給到用戶一些任務的體驗流程,然後根據他的一些反饋,通過語言、表情,然後繪製出用戶體驗地圖,從而判斷出用戶在這個任務流程中,得到了一些體驗感受,找到可能存在問題的所在節點,然後進行修改。
下面說下在訪談中需要注意的點,如何進行訪談。
那麼在口頭提問的過程中,我們需要注意些什麼呢?
目的是測試工作流程和易用性,但是在語音交互過程中,識別問題往往會阻礙用戶完成任務。最好是找幾位測試用戶,嘗試找出主要的識別問題,然後修復它。
可用性測試大概分為幾類:
(1)遠程測試(電話/視頻訪談)
優點:
缺點:沒有辦法實時跟進參與人員的反應。
(2)攔訪
這種測試方式是非常有難度的。意味著我們要去到公共場合去攔截受訪者,然後讓他參與到你這個測試當中,因為人與人的戒備心理,所以很多人都會拒絕你,如果你想提高成功率,最好準備一些小禮品或者其他的小獎勵,這樣有助於你提高攔訪的成功率。
當然你也很有可能得到的結果,會有一些偏差,受訪者會出於某些目的而回答你的一些問題,有可能並不是出於真心的。所以呢,這裡不是很建議大家用這種方法。
(3)測試完成
測試完之後,我們需要進行我們的結果分析和統計。
測試衡量的一些指標,我們大概分為5個關鍵指標:準確性、響應速度、認知速度,清晰度、友好度和聲音。
(4)注意事項
這裡需要注意的點是,一定先要預先設定好,確定每項任務完成的標誌是什麼。不然後期對結果的一個標準很難去統計,會比較混亂。
我們需要總結這是用戶對問題的回答及完成任務率錯誤數量和類型等等,從中找出用戶的痛點,用戶的一些幹擾點。按任務出錯時,用戶是否能夠自己解決呢?等等,具體需要得出的一些結論,要根據自己想要測試的一些目的來定。
在這樣我們就完成了整個可用性測試的流程。
發布之前需要做一次與測試,可以權重沒有那麼高,但也是關鍵的一步。
最重要的還是識別測試,這關係著整個產品的體驗問題,整體的測試流程需要用三級置信度和N-Best列表,以及後臺的表格相結合,找出相對應的問題節點,並且修復它。
你得清楚明白你的設備,最多的承載量,不然流量一進來,伺服器就崩潰了,這樣的體驗是極其差的。
你還得去做效果的評估。在試運行開始之前,你需要制定目標,然後看是否達到這個目標,這個效果大概是什麼樣的?是否達到預期?任務的完成率也是非常關鍵的一個成功指標。
最後到達發布階段。為了產品的穩妥起見,我們還是會進行一次試運行。
條件允許的話,重複上面一次的用戶調研的方法,然後得出一些現階段的一些問題。我們需要實時跟蹤系統的故障並快速的改進,這是我們非常需要要做到的。
大概全部的語音交互流程就說到這裡了,我們簡單的回顧下:
那語音互動設計的未來點在那裡?設計師的機會在哪裡?
戰略選擇:世界一直都是存在不確定性的,如何能夠應對呢?
眼界和選擇。
這裡延伸下梁寧在《產品思維30講》裡面說到的點線面的戰略選擇的問題,她大概說了這樣的例子:比如有一對雙胞胎,2010年一起大學畢業,一個進入了騰訊,一個進入了報社。7年之後呢,騰訊的那位如果不出意外應該是年薪百萬,而且滿街都是獵頭在挖,投資人在挖,只要出來創業就給錢。而去了報社的那位呢,報社的情況我們今天肯定了解整個產業都沉淪了,曾經他寄託理想的整個產業都沒有了,其實一切都需要重來。
在這個時候並不是說雙胞胎他們的個人的素質有問題,或者是他們的能力點有問題,點是沒有問題的,也不是他們分別跟隨的領導,比如說我們就跟老大,他們的老大的能力點和個人操守也都是沒有問題的,但是問題在哪裡?
問題是說這兩個單位所附著的經濟體,一個是在快速崛起,一個是在快速崩潰。你努力工作的公司收益,遠遠不如你在2010年以前或者2013年以前,比如說買騰訊的股票,或者是說你買一套北上廣的房子,
我們本身是一個點,我們這個點需要附著在整個整個快速崛起的「線」上,戰略的選擇,眼界的層面顯得尤為重要,和努力一樣重要,甚至往往有時候選擇比努力更重要,但選擇也是努力累計的結果。
我們設計師如何做出順應這個迅速崛起的經濟體的選擇,也是我們當下的機會,我們能看到什麼機會,我們要附著到什麼樣的線上,在當下職業邊界愈發模糊的時代,我們能力和眼界的提升,可以做到從容的應對未來的種種變故。
那麼同樣,隨之AI的發展,5G的到來,我們的很多工作方式都有可能被顛覆,語音互動設計的將會是一片藍海,雖然現在有諸多的桎梏,但這是趨勢,是快速崛起的趨勢。設計師工作你能想像未來沒有顯示器麼?沒有臃腫的主機麼?等等,未來都有可能會發生,而這一切也正在發生…..
無論世界如何變幻,未來可期,我們在路上…..
參考文獻:
作者:木七木七,歡迎交流~
本文由 @木七木七 原創發布於人人都是產品經理。未經許可,禁止轉載
題圖來自 Pixabay,基於 CC0 協議