一文看懂語音技術商業化邏輯:對品牌意味著什麼

2021-01-07 網易科技

本文系網易智能工作室(公眾號 smartman163)出品。聚焦AI,讀懂下一個大時代!

選自:medium 

作者:Marcel Kornblum 

編譯:網易智能 

參與:Rosie

引言

基於語音的技術將對許多行業產生巨大影響,在短短兩年內,預計50%的搜索將基於語音技術。該項技術的普及率可能因用戶的年齡、地理位置和讀寫能力而有所不同,但一些市場和平臺已擁有很高的滲透率,而全球10%的搜索已經是基於語音的搜索。在這一領域將會出現新的贏家和輸家,而現有品牌將需要考慮到在收購過程中失去對消費者對話的控制的影響,這加大了在競爭中脫穎而出的難度。然而,語音界面為各品牌提供了前所未有的機會,讓它們能以一種極為強大的新方式與消費者進行互動,而目前來說,很少有品牌利用到了這一點。

當前廣泛使用的功能在範圍和用途上均受到限制。就開發創新的內容和體驗,以及全新的服務來說,現下各品牌仍有機會。

那些能在此情景下崛起的品牌,在提升市場份額方面處於有利地位。此外,市面上有許多工具,讓用戶可以用最低限額的投資來輕鬆地進行語音實驗。我們的建議是儘快開始一項服務設計和聲音試驗的低投資計劃,可能還要與市場推廣活動相結合,以便讓你的品牌充分利用這項技術所帶來的機遇。

我們所說的「語音」是什麼意思?

在本文的語境中,我們對「語音」的定義是自動化的語音服務。它涵蓋了從交互式文字到實用工具內的所有信息,內置於定製的硬體設備,以及手機和雲端應用內的各種應用,可通過品牌產品或人工智慧行業內的幾大公司的虛擬助手來進行訪問。

很多關於基於語音的技術的宣傳都圍繞著智能音箱的普及(75%的美國家庭預計在2020年均擁有智能音箱),以及音響附帶的「語音助手」。現在已有幾個公司允許第三方直接整合旗下的智能助理,有點像智慧型手機上的應用。

此外,需要注意的是,不論是上文提及的還是其他語音助手也可以在其他硬體(通常是手機和平板電腦)上使用,人們可通過手機應用和深度作業系統集成來使用,但也可以通過定製硬體設備,甚至是網站來使用語音助手。

從許多方面來看,語音和機器人背後的技術都是一樣的,但二者之間在生態系統和影響這兩方面的差異足以使語音技術成為一個非常重要的領域。

語音簡史

基於語音的交互界面已經存在了幾十年,儘管它們最具影響力的方面一直是客戶服務電話。大多數與語音相關的系統都遭遇了各種各樣的問題,從語音識別到複雜的生態系統。五年前,行業領先的語音識別技術的準確率僅為75%左右,機器學習技術、系統和硬體的最新發展,使得最好的語音識別系統的準確率提高到了95%到97%。

不斷接近並跨過這一認知門檻成了當前語音產業繁榮的最大因素。人類識別口語詞彙的準確率約95%,並能使用語境來糾正錯誤。對於大多數用戶來說,任何具有較低識別準確率的自動化系統都會讓他們失望,因此這在商業上並不可行。

機器學習在意圖推導方面的相關發展(後文另作解釋),這也是產業繁榮的一個巨大貢獻因素。幾年前,這一功能的商業系統已經跨過了類似的門檻,並推動了機器人產業的繁榮;語音其實就是無文字版本的機器人。機器人本身也已經存在了幾十年,但處理自然語言的能力,而不是簡單地識別關鍵字,才帶來了基於對話的互動,這反過來又推動了相關平臺和服務近期的爆炸式增長。

在當前的語音技術領域,虛擬自動化助理的崛起首屈一指。儘管Siri(以及其他一些不太知名的語音助理)已經推出多年,但Alexa和谷歌助理的崛起預示著一種更廣泛的平臺方式。

這些新出爐的助手會在一系列設備上推廣整個生態系統和功能,Alexa可以控制你的燈光,告訴你當天的會議是什麼,並幫助你烹飪食譜上的菜品。

語音技術只是炒作嗎?

當然不是。的確,人們對語音技術的大肆宣傳,就像之前的3D列印和其他「改變我們生活方式的技術」的過度炒作一樣,但通過語音界面與計算機進行互動的趨勢將會持續下去。

除此之外,還有一系列極具說服力的統計數據,例如,超過20%的移動搜索已經是基於語音的搜索,並且,預計到2020年,這一比例將上升到50%。或許更有趣的是,這些統計數據背後有一些原因也許更值得我們去探討。

在科技圈,人們經常說,未來初次上網的10億人中的大部分,其受教育水平很低,還很可能是文盲,因為「不發達」國家的人們也開始接觸網際網路。對於這些群體來說,視頻和聲音或許是最重要的,而且聲音可能是他們能接觸到的唯一雙向媒介。

此外,iPad效應還揭示出,即使是非常年幼的孩子,還握不住滑鼠時也能與觸控螢幕互動,而語音交互甚至能更快、更直觀與孩子互動(一旦有人可以說話),而且毫無疑問將成為幾年內某些功能的主要交互方式。

此外,也值得考慮到這其中涉及到的風險和利益,尤其是谷歌和亞馬遜這兩家分別在廣告收入和發掘新產品方面最強大的公司。亞馬遜進軍語音市場的舉動,已經對谷歌的利潤產生了明顯的影響,因為它使得搜索業務走出了網頁和谷歌廣告的覆蓋範圍,這也解釋了為什麼谷歌要努力讓旗下的谷歌助手取得成功。為了自身利益,谷歌可以利用他們現有的25億臺Android設備。隨著數字的不斷增長,你可以理解,到2021年預計將會有75億個已安裝使用的語音助理。在某些方面,對隱私和安全的擔憂會慢慢地被採納,我們將在本文的後續部分對此進行探討。

反對語音技術的一個常見言論是,對著設備大聲說話,尤其是在公共場合會讓人覺得怪異或者是尷尬(尤其是年齡大一點的人會這樣覺得,我們指的是20歲以上的人)。BBH公司的觀點是,這些標準很快就會改變。例如,十年前,在大多數情況下,把手機放在餐桌上簡直是天方夜譚,如今,這可能是一種專注的表現(取決於細微差別),或者在某些情況下,在吃飯時接聽電話或寫簡訊也是可以接受的。

應用場景

語音正在迅速為產品和服務的技術接觸點的融合創造一個空間。從許多方面來看,這並不令人驚訝。使用我們的聲音進行交流的速度是打字的3倍,而且說話比打字要容易得多。

儘管它帶來了一種全新的社會規範,但這是一件很簡單的事情,用戶只要用30分鐘就可以輕鬆地享受這個全新的界面。

在某些情況下,聲音可以輕而易舉地打敗非語音輸入方式,比如手是溼的或者兩隻手都空不出來,比如做飯和洗澡,或者眼睛只能專心幹一件事時,比如駕駛,還有其他一些對於我們來說需要一定程度上使用我們的雙手和眼睛的事情。在這些情況下,使用語音輸入顯然更加輕鬆。

儘管語音在可預見的未來不太可能完全取代文本,但它無疑會對許多與技術相關的領域產生重大影響,尤其是電子商務和搜索領域。

對市場和品牌的影響

這為各品牌和新的加入者提供了參與語音體驗的機會。電子商務行業的一個全新的、廣泛使用的系統總是具有巨大的顛覆性,目前還無法詳細了解語音對品牌的影響。

首先要考慮的三大因素之一是,許多交互將完全在平臺上進行,減少或移除了搜索營銷的機會。其次,基於對話的互動並不能很好地支持項目列表,這意味著助理們通常會推薦單件商品,而不是向用戶展示選項。最後,在很多情況下,整個購買過程將會在沒有視覺刺激的情況下進行。

所有這些因素目前都受到了廣泛關注,但可以肯定的是,這將對品牌帶來巨大的影響(特別是快速消費品行業的品牌),尤其是當這三大因素與其他因素相結合,如亞馬遜目前作為市場和自有品牌供應商的雙重身份在電子商務業的主導地位。

目前正在討論的兩種有可能解決這些新挑戰的策略是,要麼向平臺推銷,比如確保亞馬遜、谷歌等向用戶推薦你的產品,或試圖大幅提升品牌認知度,讓用戶通過名字而不是產品類別在平臺上尋找你的產品。例如,英國人說「胡佛」就意味著「吸塵器」,或美國人使用「施樂(Xerox)」就是說的 「複印」。

在接下來的幾年裡,許多品牌將會出現在語音平臺上。它們可以採取任何形式,從提供實用工具的服務,或減輕客戶服務的負擔,到通信和營銷還有娛樂。由於語音界面的會話特性、缺乏有保證的視覺效果以及在感覺溝通中語境所扮演的角色,很少或沒有品牌會完全依賴於語音。它不會取代社交、電視、印刷品和網絡,而是成為這些平臺的補充因素。

同樣值得注意的是,不論哪一個品牌,都有一小部分用戶不能說話或聽到聲音,對於他們來說,只有語音界面無法訪問(儘管像Google Assistant這樣的平臺也有視覺界面)。

從理論上講,語音技術為品牌提供了一個前所未有的機會,可以以一種私人的、甚至是親密的方式與消費者建立聯繫,在所有潛在的品牌接觸點中,沒有一個能有語音那樣的潛力,能大規模地與消費者建立深厚的人際關係。與此同時,現有的助理平臺都給想要在某種程度上實現情感聯繫的品牌提出了一些嚴肅的問題。

谷歌助理為各品牌提供了最為豐富的平臺機會,但相比谷歌自有品牌來說依然還是有區別,而亞馬遜Alexa則對品牌有額外的限制。話雖如此,語音技術的確代表了一個全新的擁有一些引人注目的品牌特徵的渠道,儘管其缺點可能代表著一個提升品牌認知度的重要機會。

語音帶來的類人特徵

眾所周知,人們把人類的特徵分配到他們的所有互動中,但是這種現象在口語對話中尤其明顯,這是如此,人們會對語音助理產生感情。超過三分之一的普通用戶希望自己的助手是人,四分之一的人則對自己的助理產生過幻想。

基於語音的服務首次允許品牌完全構建代表它們的實體的特徵。與選擇品牌代言人相比,這一過程的深度和廣度都是相似的,重要的是要考慮代表品牌或服務的聲音的各個方面。

設計語音界面時值得考慮的因素包括:(虛擬)說話者的性別、種族和年齡,以及他們的口音。也許可以有多種不同的聲音,但這就提出了一個問題,即如何選擇使用哪一種聲音。也許是通過提供的服務或者客戶來源(如果知道的話)或其他數據點。

另一個有趣的因素是虛擬角色與用戶和品牌的關係。語音助理是否像主人一樣?是一個顧問?也許是家庭成員之一?是否代表了品牌本身?或者它是以第三方的身份談論品牌?在它說「我來幫你查一下」時,這是否意味著你可以使用與助理本身截然不同的品牌核心服務?

當然,還有一些技術因素需要考慮,這取決於你所創建的服務和它所依賴的平臺,在這平臺上你也許根本不可能創建一個定製的語音,或者平臺上可能存在著對定製化可能性的限制。下文將對此進行更詳細的探討。


在某些情況下,你甚至有可能探索更豐富的因素,比如聲音的音質和一些「柔和」的方面,比如語言所帶來的溫暖。

最後,值得注意的是,語音機器人與單獨的用戶進行的是雙向對話,這些對話完全是由品牌所控制的,在對話中,沒有人會有糟糕的一天,或者感到疲憊。

語音服務設計

無論是基於實用性、娛樂性還是其他特徵,在構建基於語音的服務時,一些核心因素都會發揮作用。這些因素導致為品牌打造全新服務的情況並不少見。顯然,重要的是要考慮到沒有屏幕對用戶體驗產生的影響。

舉個例子,在一個語音界面上,搜索結果的列表讓人很難滿意。你可以做一個實驗,大聲讀出谷歌搜索結果的第一頁就行。這意味著,用戶體驗往往更「受引導」,而較少依賴用戶去選擇,儘管也存在著很多其他的含義。

考慮到這一點,我們也要注意到,越來越多的語音平臺用戶可能擁有他們和語音助手都能訪問的屏幕,要麼是內置在設備中(比如Echo Show),要麼是通過智慧型手機或生態系統的屏幕,比如谷歌助理。雖然不能完全依賴這些屏幕,但它們可以用來豐富用戶體驗。

另一個重要的因素是界面的對話性質,這對服務設計的細節產生了巨大的影響,但也可能意味著用戶可選擇有高比例內容的選擇服務,或者至少是通過決策矩陣進行線性旅行是有意義的。此類界面往往對複雜的流程極為有利,因為在這些過程中,基於屏幕的界面往往會變得混亂並讓人感到困惑。

最後,和社交一樣,周圍環境對於用戶訪問語音服務的方式非常重要。如果他們正在使用手機時,他們可能在公共場所或家中,他們也許匆忙也許悠閒,所有這些都會影響到服務質量。如果用戶通過智能音響訪問該服務,他們很有可能在家,但可能會有其他人在場,這就再次影響了服務的細節。

一般來說,非常適合於使用語音的服務在範圍上通常是有限的,並且只能提供給用戶很少的交互。更複雜的現有服務通常需要人工智慧工具來進一步簡化它們的訪問過程,然後才適合使用語音進行訪問。

語音技術優化因素

在過去的兩三年裡,隨著基礎技術達到了重要的臨界點,語音技術的前景發生了巨大的變化。從谷歌、亞馬遜到IBM和三星,許多大型科技公司似乎都在語音領域提供了服務,但它們各自提供的服務存在巨大差異。

1、設備和環境

需要指出的是,許多設備的確擁有超越語音功能的能力。一般來說,智能音箱只播放聲音,但當它們在向用戶顯示它們在聽和回應的時候也會有燈光,這也因此有助於引導對話。

更新後的Alexa設備,比如Echo Show和Echo Spot,現在可以通過內置的屏幕和攝像頭傳送信息,而谷歌助理在智慧型手機上最常用的功能是,默認情況下,屏幕會用文本來顯示對話。

在智慧型手機和其他一些設備上,用戶可以選擇通過文本而非語音來進行整個對話,這將改變他們接收到的輸入類型,以及輸出中會出現的細微差別。

基於屏幕的會話界面正在快速發展,還包括交互式模塊,如列表、幻燈片、按鈕和支付界面。很快,語音控制助手也將可以使用附近的聯網電視來補充會話界面,不過在這裡展示的內容與智慧型手機界面不同。

應該清楚的是,除了廣泛的可用功能外,影響語音交互的另一個主要因素是周圍環境。用戶可能是在個人設備上,也可能是在共享的公共空間中使用語音助理,比如廚房或辦公室,這將影響他們進行舒適交互的方式。

2、平臺和生態系統

① 亞馬遜Alexa


也許最著名的英美語音服務是亞馬遜的Alexa,一開始可以通過Echo音箱設備來訪問,但支持訪問的亞馬遜和第三方硬體也越來越多。亞馬遜在市場上擁有相當大的先發優勢(72%的智能音箱市場份額),而且這可以說是亞馬遜Echo系列設備的商業成功,這些設備所支持的其他公司提供的服務最近數量激增。

Alexa是一個面向消費者的平臺,可以讓品牌廠商創造消費者可以安裝的「技能」。終端用戶可以通過一個配套應用來配置Alexa。除此之外,用戶還可以在應用商店中安裝來自第三方的「技能」。一項安裝的技能就可以讓終端用戶向Alexa詢問一些特殊的額外問題,這些問題能顯示出該技能所提供的服務,例如,「Alexa,我的銀行存款餘額是多少?」

目前,在所有市場中,Alexa的技能數量約為2萬,2016年底這一數字還只有6000。

儘管目前許多技能的使用率極低,但亞馬遜最近推出了融資模式,以繼續激勵第三方開發者加入其生態系統。據估計,到2017年底,Alexa設備的銷售量大約有3200萬臺(在第四季度時約為2000萬),毫無疑問,這個平臺的覆蓋範圍很廣,但Alexa技能的模式和亞馬遜的整體市場戰略的結合讓各品牌方處於亞馬遜的控制之下。

② 谷歌助理(Google Assistant)


就在亞馬遜推出Echo音箱一年後,谷歌在2016年5月推出了這款Google Home設備,這款設備內置谷歌助理。谷歌一直在積極地向消費者和合作夥伴以及品牌推銷其谷歌助理(以及家用硬體設備)。谷歌已經佔據了15%的智能音箱市場份額,是前一年的兩倍,而智慧型手機語音助理的市場份額為46%,預計到2022年這一比例將上升到60%。

谷歌的智能助理也在以不可思議的速度更新,新功能層出不窮,可以說,它已經在給用戶和第三方開發者提供功能方面領先一步了。或許最有趣的是,與其他產品相比,谷歌助理在品牌整合方面採取了一種有趣而不同的方式,正如Actions on Google這樣的應用平臺。

通過這個平臺,品牌不僅可以開發服務,還可以開發整個會話界面,包括他們所提供服務的語音輸出。用戶不需要安裝第三方應用,只要直接要求與這些應用對話即可,就像有人會要求總機或接待員與某個特定的人通話一樣。一旦與某款應用進行對話,用戶就可以通過基於谷歌助理的語音界面使用身份驗證、允許通知、切換設備和支付等功能。

通過將谷歌助理與Android緊密結合,這個平臺擁有巨大的潛力;目前有25億臺使用中的Android設備。該軟體也可為第三方硬體製造商使用,進一步提升了該生態系統的潛力。

③ 微軟小娜(Cortana)


每一臺Windows 10設備都裝載了微軟小娜,其月活躍用戶數達到了驚人的1.45億人次(用戶可能主要是通過XBox訪問),但微軟對Cortana的推廣和更新要低於谷歌和亞馬遜對旗下產品的推廣和更新力度。Cortana提供了類似於Alexa的「技能」界面,但它的開發時間相對較晚,在核心功能和可用整合數量方面也尚不及Alexa。

儘管微軟小娜在智能音響設備上的份額很小,但微軟龐大的整體用戶群,以及它在與工作相關的軟體和遊戲生態系統中佔據的主導地位,確實讓Cortana在市場上擁有了強大(並且不斷增長)的存在感。

④ 百度DuerOS


百度可以說開創了語音界面的最新潮流,它結合了突破性的技術和龐大的用戶群,以及不同的文化和社會經濟傾向,更偏向於使用語音技術而非文字技術。百度最近發布了DuerOS(新一代對話式AI作業系統),這是一個讓第三方硬體開發者打造自己的語音驅動設備的平臺,通過「百度大腦」提供了一套用於各種用途的人工智慧平臺(其中很多都涉及語音功能)。目前,大多數消費者通過百度僅支持中文的服務與其語音技術進行互動(即沒有第三方整合)。

⑤ Siri、Bixby和Watson

蘋果的Siri和三星的Bixby都是語音助手,目前支持在特定設備上使用,也可以在製造商的生態系統中使用。這兩種語音助手都不能被稱為平臺,因為它們不提供第三方訪問來創建服務。

目前,這兩個語音助手的市場份額都是有限的,因為可支持的手機數量有限,但它們有使用門檻,且語音識別準確率也較低,使得它們在與其他助手的對比中顯得很有限。IBM的Watson也許是最有效的工具,可以被看作是品牌可以用來創建定製服務的一套工具。

3、內容和服務

在為基於語音的對話界面設計服務時,需要考慮很多因素;這些因素均在上文提到過,會影響可用的功能範圍。

① 效用

目前可用的大部分語音服務都是實用型工具,它們可以通過其他方法獲得簡單的功能。既有更普通的功能(播放特定的廣播電臺或聽新聞),也有更具未來感的(在電視上調整燈光或播放特定的電影),還能訪問特定於供應商的功能,比如點一份披薩或者叫一輛計程車。

許多品牌開始在這一領域提供服務,從家庭自動化或類似於WeMo、Plex或Philips Hue這樣的小企業,到更廣泛使用的服務,如Uber和Dominos,但有趣的是,這一領域還有提供創新服務的大品牌。例如,梅賽德斯和現代都允許用戶啟動自己的汽車,並在不同的語音助理平臺上預熱汽車。

② 娛樂

各種各樣的遊戲、笑話和音效庫都可以從所有的主要平臺獲得,這些平臺來自於各種各樣的提供商,這些提供商要麼是平臺提供商本身(比如谷歌或亞馬遜),要麼是小公司或個人開發者。不過,有少數幾個品牌開始更多地嘗試這一平臺的可能性。例如,Netflix和谷歌推出了《陌生人的伴侶》第2季,而BBC最近為Alexa製作了一段互動小說。這一領域的娛樂項目潛力尚未得到開發,只是處於初步探索階段。

③ 工具

有許多工具可以用於構建語音服務,以及相關的(通常基於人工智慧)的功能。總的來說,基於雲計算的服務就算不免費也很廉價,而且易於使用。一些嚴肅的項目可能需要人們自行開發定製解決方案,但這對於大多數需求來說都有些多餘。對所有可用工具的完整介紹不在本文涵蓋的範圍之內,但值得注意的工具有IBM的Watson Services、谷歌的Speech API和DialogFlow,以及微軟的認知服務(Cognitive Services)。

所有這些都意味著,原型設計和實驗可以快速、低成本地完成,而生產就緒的應用程式也可以在一個使用模型上進行成本估價,這種模式在小範圍內是非常划算的。

④ 語言合成

有關於各品牌尤其值得注意的是,其圍繞語音合成的選擇,因為這些都是終端用戶與之互動的品牌的一部分。如果提供的服務有一個靜態的、有限的、針對所有用戶輸入的可能響應,那麼就有可能使用錄製好的語音。在某些情況下,這種方法可以進行擴展,與記錄並剪切結合的方法一同使用。

對於擁有廣泛輸出的服務,生成的聲音是唯一可行的方法,但即使是這種情況,也有多種選擇。有很多免費的、或多或少的「計算機」聲音可供使用,但我們建議探索其他的方法去創建像衛星導航一樣的語音合成系統。

機器學習技術的快速發展,讓生成的語音聽起來非常真實,甚至像真人一樣,這值得關注。這一技術目前還沒有普及,但谷歌已經在美國使用Wavenet來輔助谷歌助理,而Adobe也正在開發一個類似的項目。

語音背後的技術

人們所說的「聲音」其實是一套不同的技術,它們需要一同運作。值得注意的是,Speech To Text是處理一些音頻和輸出文本的「語音識別」組件。近年來,這一領域取得了巨大的進步,以至於一些系統在不同的條件下比人類更擅長於語音識別。據報導,今年6月,谷歌系統的準確率達到了95%(與人類相同,比4年的準確率上升了20%),而百度則被認為擁有語音識別最準確的系統,其準確率在97%以上。

每個特定服務的核心都是意圖推導,一組基於計算出一條文本暗示潛在用戶意圖的技術集合,這將用戶請求與該服務能夠提供的響應相匹配。機器人和機器人平臺的數量最近的增長(和炒作)與這項技術有關,而且幾乎所有的語音系統都是加入語音識別的機器人,這項技術至關重要。有許多平臺提供了這種功能(尤其是IBM Watson,以及免費的DialogFlow)。

另一套重要的語音相關技術是語音合成。實現這一目標的方法有很多,而且這些選項與特定語音服務的功能密切相關。本文前面已經探討了與此相關的工具和選擇,但是它們的成本和質量都存在著巨大差別,因為基於服務的範圍和可以提供給用戶的輸出類型存著著差異。

隱私問題

與其他數字服務相比,創建語音優先服務需要多加考慮。首先也是最重要的一點是,用戶的隱私受到越來越多的關注,因為用戶的音頻記錄被發送並經常存儲在平臺和/或品牌那裡。

根據對用戶提供服務的方式,這可能只是一個涉及平臺的問題,也可能是該品牌需要直接解決的問題。

最近,C4 Show《名人搜索》引發了對Alexa的強烈抵制,因為用戶們直接看到了存儲的錄音有被洩露的危險。也有人擔心錄音具有的「永遠」的存儲能力,儘管主要的平臺一再試圖向用戶保證,只有從關鍵字開始的短語才會被記錄下來並被發送到雲端。然而,就像大多數事情一樣,合理的價值交換是最安全的方式。從本質上講,應當確保產品的實用性或娛樂性。

本文前面提到的另一個注意事項是,可能你的品牌暫未提供語音優先界面的正確服務,或者至少是服務可能需要進行改動以完全適合這種格式。我們在研討會上發現,品牌語音服務最有趣的用例往往需要向全新領域擴展。或許最有趣的是,這個領域允許收集關於使用該服務的用戶的一整套全新的有趣的數據,除了實際的音頻記錄,新環境中使用的新服務應該會帶來有意思的新想法。

對品牌的建議

我們相信,從長遠來看,許多品牌將受益於通過語音界面提供部分或全部的核心數字服務,而且最近的技術擴散在中短期內創造了機會。一個很好的起點是開始將語音平臺加入到數字服務的長期規劃中。理想情況下,品牌應該從長遠角度規劃整體的語音(或語言助理,包括機器人)策略。這將包括哪些服務最適合這些不同類型的媒體,以及它們如何與客戶服務、客戶關係管理、社交和廣告功能互動,以及衡量工作進展的路線圖。

短期來看,我們認為品牌應該進行試驗,用現成的工具快速製作原型產品,甚至創造出短期的產品,或許還要與營銷活動相結合。重點關注這些試驗的關鍵領域應該是,整體品牌風格、語調和客戶服務腳本如何轉化為語音角色,以及用戶如何應對這種角色的變化。這種試驗可以結合使用輕量級的語音優先服務設計來服務於營銷活動,但也能用於建立一套完整的指導和學習工具,為未來的核心品牌服務所使用。

相關焦點

  • 科普丨一文看懂語音識別的技術原理
    簡要給大家介紹一下語音怎麼變文字的吧。希望這個介紹能讓所有同學看懂。首先,我們知道聲音實際上是一種波。常見的mp3、wmv等格式都是壓縮格式,必須轉成非壓縮的純波形文件來處理,比如Windows PCM文件,也就是俗稱的wav文件。wav文件裡存儲的除了一個文件頭以外,就是聲音波形的一個個點了。
  • 產業報告 一文看懂中國光伏組件技術發展(雙面/MBB/半片/疊瓦/背板...
    產業報告 一文看懂中國光伏組件技術發展(雙面/MBB/半片/疊瓦/背板等)北極星太陽能光伏網訊:(來源:公眾號摩爾光伏)原標題:一文看懂中國光伏組件技術發展雙面/MBB/半片/疊瓦/背板等)郵箱:chenchen#bjxmail.com(請將#換成@)北極星太陽能光伏網聲明:此資訊系轉載自北極星電力網合作媒體或網際網路其它網站,北極星太陽能光伏網登載此文出於傳遞更多信息之目的,並不意味著贊同其觀點或證實其描述
  • 一文看懂納米碳材料現狀:有望顛覆數十億美元半導體行業 但商業化...
    然而,新材料的商業化是非常困難的。將實驗室結果用於大規模生產是一個漫長而危險的過程,類似於將新藥推向市場。技術障礙以及實驗室時間和生產的高昂成本導致很多顛覆性的材料在早期就宣告失敗。對於納米碳材料,導電性問題和生產挑戰意味著——基於碳納米材料的計算機晶片可能比最初期望的更遙遠。創業公司、研發部門和大學實驗室目前都在紛紛研發和推出獨特的納米碳材料。
  • 一文看懂矽負極的商業化進展
    2016年, Model 3的動力電池採用了矽碳的技術路線,這也引發了行業人士對高能量密度動力電池技術路線的激烈討論。具體而言, Model3在傳統的石墨負極材料中加入了10%的矽。 分析人士認為,為了有效控制矽的膨脹,Model3主要採取氧化亞矽與石墨材料進行複合的技術路線。
  • 一文帶你全面熟悉智能語音之麥克風陣列技術的原理
    一文帶你全面熟悉智能語音之麥克風陣列技術的原理 佚名 發表於 2017-12-13 14:06:22  麥克風陣列(Microphone Array
  • 一文看懂臺積電的技術布局
    餘振華表示,在每一代的SoIC技術上,公司都希望能達到70%的線性微縮率。餘振華在會上指出,SoIC的研發著眼於廣泛的應用,其中之一是高頻寬、高效率的邏輯與存儲的堆疊,這對於未來的HPC和AI的應用非常重要。而臺積電則在這方面提供了低溫多層記憶體晶片堆疊在邏輯器件上的結果。據透露,臺積電在其上面堆積了四層、八層和十二層的晶片。
  • 一文看懂IBC太陽能電池技術
    一文看懂IBC太陽能電池技術 1975年,Schwartz首次提出背接觸式太陽電池,最初應用於高聚光系統中。經過多年的發展,研發出了交叉指式背接觸(IBC,Interdigitatedbackcontact)太陽電池。
  • 一文看懂史前巨獸—英菲尼迪QX80
    1987年:品牌名稱誕生 由此英菲尼迪品牌名稱誕生。品牌設計標識上的兩根中間線延伸向前,向正不斷前行,挑戰無限的道路和信念。 2002:首創的語音識別 這一年我們在交互技術方面取得了巨大進步
  • 漫步者不斷新高,一文看懂無線耳機!
    這背後是什麼動力!無線耳機賽道如何現在關注為時已晚嗎?但是比起漫步者和國光、甚至興旺達,都算不得什麼。再一次說明還是聚焦最強的強勢股。但是當時沒有認真做功課,現在來補補課。,一種無線數據和語音通信開放的全球規範,它是基於低成本的近距離無線連接。
  • 車輛麋鹿測試是什麼?一文看懂測試的安全價值!
    車輛麋鹿測試是什麼?一文看懂測試的安全價值!   相信不少關注汽車的朋友經常會看到一些汽車評測項目,除了常規的加速、制動以及駕駛體驗測試以外,還有一個比較陌生的測試項目,叫做「麋鹿測試」。為什麼這項測試以麋鹿命名?做麋鹿測試的意義何在?麋鹿測試結果對於消費者而言又有怎樣的參考價值?下面就一探究竟。
  • 一文讀懂,語音互動設計流程
    我們的現狀,我們正處於下一階段的初期階段,我們手機已經可以用語音處理很多事情了,但是還有很多事情是無法處通過語音完成的。3.VUI的一些優勢和局限性(1)優勢速度:顯而易見的是速度變快了,國內的語音,語音轉文字的技術已經很大程度上提高了人們效率;釋放雙手:比如你在開車的時候,你可以直接對著你的手機語音助手說,嘿XX,麻煩你幫我做XXX;
  • 一文看懂 HoloLens,Magic Leap…詳解AR光學技術產業鏈
    這一領域最基本的波導最初是由以色列軍方出身的光學公司Lumus(阿里巴巴、HTC等投資)進行商業化的。最近,這家公司也成為著名工業AR頭盔廠商Daqri和Atheer的供貨方。 表面出射波導技術是諾基亞公司申請專利,並最先完成商業化的。
  • 一文縱覽人工智慧的23個分支技術(上)
    本報告所討論的「技術(technology)」是一個廣泛的概念,包含了人工智慧領域所使用的方法、算法和模型,我們將使用「技術」一詞指代這三者。3.2.1 邏輯人工智慧領域用邏輯來理解智能推理問題;它可以提供用於分析程式語言的技術,也可用作分析、表徵知識或編程的工具。目前人們常用的邏輯分支有命題邏輯(Propositional Logic )以及一階邏輯(FOL)等謂詞邏輯。
  • 一文知道人工智慧的分支
    打開APP 一文知道人工智慧的分支 科技世界雜談 發表於 2021-01-17 10:35:26   人工智慧是計算機識別,推理和行動的實踐方法
  • 排名 語音識別_語音識別技術排名 - CSDN
    一般而言,即時消息無非語音或文字,子彈簡訊它發出的消息做到了實時語音轉文字,語音識別率可達97%,用戶還可以選擇同時發出「語音+文字」。發布會後,子彈簡訊已在各大Android應用商店和蘋果AppStore中火速上架。意味著,除錘子自家手機,其他智慧型手機也能體驗。從實際產品體驗感知,語音是子彈簡訊的靈魂所在。
  • 一文看懂OriginOS帶來的改變
    01 信息管理方式重構 大變樣的桌面布局讓人眼前一亮初上手體驗OriginOS,與FuntouchOS相比,感覺最大的變化就是桌面的布局設計,App圖標、桌面組件、壁紙,以及控制中心等各方面都進行了重構,新系統的桌面與國內任何一家手機廠商的系統都不同,讓人眼前一亮。
  • 一文看懂語音合成:真能跟Siri戀愛?模擬人類語言暗藏哪些商機
    從Siri開始的熱潮,語音合成潛力無限2011年10月4日,一場名為"Let's talk iPhone"的手機發布會正引起全球關注,在這場發布會上,iPhone 4S搭載Siri亮相,從此,Siri這一可以執行人類口語指令並給予語音回應的語音助手成為了蘋果所有硬體的標配。同時,Siri的熱潮也拉開了語音合成技術運用的大門。
  • 一文看懂取樣電阻的工作原理
    打開APP 一文看懂取樣電阻的工作原理 發表於 2019-08-18 11:16:35   一,電流檢測電阻的基本原理   根據歐姆定律
  • 尼爾森AI助手報告出爐,如何用語音喚醒下一個商業時代?
    這一時期,由蘋果、微軟率先將智能語音助手這一產品引入中國,其中以搭載在iPhone 4S上的Siri最為驚豔,開始在國內掀起智能語音助手熱潮。2. 市場啟動期(2012——2015年)。在蘋果的帶動下,科大訊飛上線中文語音識別DNN系統,推出「靈犀語音助手」,百度、華為等也紛紛入局,行業迅速發展。
  • 一文看懂MSDS
    看懂MSDS的重要性---有些朋友會提及在中國做化工等危險品產品的出口運輸,一般都需要上海化工研究院或北京迪捷姆(北京DGM)等出具專業危險品分析報告,另外MSDS在中國也有造假情況,所以能否看懂MSDS不是太重要。