智能音箱們,亞馬遜Echo的成功再難複製了

2020-12-17 虎嗅APP

有一種說法,2018年,智能音箱一準爆發。的確,在2017年,BAT輪番推出智能音箱,Rokid、出門問問等創業公司也趁勢布局,國內智能音箱的出貨量也從十幾萬上升到百萬級,資金高速湧入,中國「百箱大戰」將正式拉開序幕。

儘管,整體看好智能音箱未來市場,甚至有預測稱2018年全球出貨量將達到5630萬臺;但也有相對保守派認為,2018年智能音箱行業並不會爆發,主要依據智能音箱的語音交互能力較弱、內容服務生態不足、跨場景跨任務對話能力較差等因素。

思必馳的CMO龍夢竹,就持後一種觀點。思必馳是國內為數不多擁有自主智慧財產權中英文綜合語音技術的公司,其客戶包括阿里、騰訊、小米、海爾、聯想等,對於語音識別技術的現狀,思必馳是具備發言權的。

眼下,智能音箱市場有點冰火兩重天的意味。在不久前剛過去的2018CES(消費電子展)上,智能音箱頗受矚目,被視為家庭場景的最佳智能入口,可國內,雖然BAT、小米等巨頭紛紛入局,但出貨量並不可觀,這讓智能音箱在國內的處境有了幾絲尷尬。

到底智能音箱是否是偽需求,語音交互是否符合中國的國情?

的確,基於家庭場景的智能生活正在燃爆下一個消費級市場,至於這個場景是不是由智能音箱來帶動,卻是個未知數。

由此,虎嗅「大咖私房話」邀請到思必馳CMO龍夢竹與虎嗅會員進行了一場2小時的圓桌對談,分享了她對當前智能音箱發展、機遇的理解,剖析了未來智能音箱發展趨勢以及在聲紋識別上的技術突破與當下瓶頸。我們將現場錄音整理出來,復現了這場對話,乾貨滿滿。

想了解更詳細的案例分享、全部圖文,以及深度問答,歡迎點擊閱讀原文 加入虎嗅會員解鎖分享內容全文。

Echo成為爆款的背後,反映的是國內音箱市場崛起面臨的問題

首先一點,無論是百度Raven H,還是亞馬遜Echo,在一定程度上都是為了展現背後的對話定製平臺。在這樣的戰略目標下,他們做這樣的硬體根本沒有考慮盈利。

至於說Echo,Echo是集亞馬遜生態與資源優勢為一體的集大成者,其成功並非偶然,成功的因素也未必能為國內音箱市場崛起帶來普適性的借鑑,但其快速的發展必然會推動語音技術應用落地。

第一,音質是選購音箱的首要條件,包括很多媒體都會做相關的評測,首先就是從音質開始,低音、高音、杜比音效等等。

第二,性價比是用戶購買的關鍵因素,Echo在正式上市前,硬體已經迭代了很多版本,成本投入很大,是沒太多收益的,只能是量產之後薄利多銷,而對終端消費者來講,需要的只是高性價比。比如去年有一款「折衣服機器人」,不管多亂的衣服,在十幾秒種時間都能迅速疊放整齊,但售價高達十萬塊,幾乎無人購買,所以,在價格與技術投入之間去掌握好平衡點才是關鍵所在。

第三,銷售渠道;Echo依靠的渠道是整個亞馬遜的生態服務,亞馬遜把AWS雲服務、Kindle跟Echo進行整合,鋪設了很廣的銷售渠道。

第四,內容服務;亞馬遜將音頻服務,包括Kindle、有聲讀物,全部融入到Echo內容服務上,內容資源得到充分積累。

第五,語音交互;Echo在技術上最顯著的代表性意義,則是把語音的遠場交互迅速落地,率先將遠場麥克風陣列集成在產品裡,無論聲源定位、遠場喚醒、語音交互,都帶給用戶極其新鮮的產品體驗。

但Echo在中國的銷量還不理想,當然大部分原因是Echo目前沒有支持中文,以及在整個生態和內容服務上沒有完全打通,這也給中國的音箱發展創造了非常好的條件。

眼前中國智能音箱的瓶頸在於:音箱們的智能交互體驗,跟語音交互技術、後端服務和生態合作都是相關的,而這幾點也恰恰是國內音箱的劣勢。

以語音技術為例,當技術落地應用,語音其實只是交互的手段,並不是產品功能,效果的優劣主要是由是否最終能滿足用戶需求來決定的,簡單說,好不好用是由語音技術,內容打通能力等綜合決定的。

比如有些人買了某音箱,覺得還是不好用,就會問是不是語音技術有問題?語音技術什麼時候能夠成熟?比如,當用戶對著音箱說「我要聽趙雷的《成都》」而產品反饋「對不起找不到您要的歌曲」,消費者下意識會認為是語音識別不好,搜不到歌曲,但這背後很有可能是音樂內容提供商沒有這首歌的版權;或者產品本身某個硬體模塊沒有選得特別好,比如晶片選擇不好可能會延長語音識別的時間。

對用戶來講,語音是用戶跟產品發生關係最直接的感受,於是所有的鍋,最後都是由語音技術來背。

國內智能音箱整體上還未到爆發節點

很多人都在問2018年音箱能火起來嗎?

從語音交互、內容服務,包括用戶的接受能力,其實還達不到音箱真正爆發的節點,音箱帶動的更多的是大眾對智能家居的認知,讓大家看到物聯網的發展及智能家居的未來,而真正能火起來的可能不一定是音箱,有可能是智能門鎖,智能路由等。

2018年應該會有中國本土的創業企業研發的智能門鎖大規模鋪向C端市場;再比如電視,電視在2018年、2019年會是個分水嶺,之後所有的電視應該全部都有語音功能。

但音箱目前還不具備成為剛需的條件,那為什麼音箱會成為目前商家探路市場的首選?這是因為音箱本身是一個天然的、最好的音頻載體,第二,音箱比較輕量化,進入門檻相對較親民。

也許明年,市場上會出現更多類似於智能音箱的變體,比如音箱大部分是圓柱體,是為了收音和識音,還有音頻播放。但如果把音箱中部挖空,把它拔高,做成花瓶,那是不是就可以不用叫智能音箱了?

所以未來真正會爆發的是「智能助理終端」,真正能夠解決用戶交互需求,家居的控制等等,而不在乎是什麼形態。

另外,中國作為一個農業大國,對爆款產品的定義一定不是說產品體驗多好、價格多低,而在於賣的多好。要賣得好,渠道是很重要的因素。只有打入三四線市場,比如現在的手機,蘋果、華為炒的較熱,但OPPO、vivo,的市場佔有率卻是非常大的,它們走的就是打入中國廣大的三四線市場,因為這一塊才是最有消費潛力的,而音箱如果在一兩年內想打入三四線市場,可能沒有那麼容易。

我們再說回今天的主題,智能音箱。

智能音箱只是外在的終端形態,我們要評價智能音箱的好壞,就需要關注其背後的綜合能力,首當其衝的是智能語音技術。

從網際網路時代到移動網際網路,再到物聯網時代,設備數量呈現指數級的增長,信息獲取也從文本信息處理發展到對話搜索。

隨著對語音技術、新場景的挖掘,物聯網市場迅速發展,智能硬體設備數量將達到100億量級,文本信息交互變得越來越弱,而語音和對話交互成為發展的需要,信息獲取也從終端為中心轉移到以用戶和場景為中心,這是整個時代的變革。

比如,在2014年的時候,以智能手環為代表的可穿戴市場開始興起,短時間內國內出現了幾千家做智能手環的企業,但又迅速的銷聲匿跡。再到2016年基本上很少看到手環或者可穿戴產品的存在,而今年隨著整個AI技術,尤其是語音技術,還有新場景的挖掘,穿戴設備市場又將會慢慢地恢復起來。

聲紋識別雖是趨勢,但大規模商用還需時日

最近關於聲紋識別的討論很多,那我也來講一下這個事情。(虎嗅註:聲紋識別又稱說話人識別,是生物識別技術的一種。該技術通過語音波形中反映說話人生理和行為特徵的語音參數,進而分辨出說話人身份)。

我認為聲紋識別大規模商用的時機還遠遠不到。我說一下我的理由——

目前,聲紋識別目前分為兩種形式,一種叫說話人辨認-SI(Speaker Identification)

,屬於一對多的關係,就是在一群說話人中,通過去識別其中一個人音頻和信號去確認這個人是誰,應用的場景包括刑偵破案、罪犯跟蹤等;另一種叫說話人確認-SV(Speaker Verification),屬於一對一的關係,通過採集的數據來確認說話人,應用場景包括證券交易、支付購買、聲紋鎖等,民用場景應用性更強。

但目前在做聲紋識別方案的時候,通常是將聲紋作為一種輔助認證,把聲紋和人臉進行結合,雙重驗證,或者把聲紋跟傳統的密碼支付來進行綁定。但對於聲紋識別大規模的商業應用還需要時日,做好產品的交互體驗也是關鍵所在。

在聲紋識別裡邊最大的難點,首先語言是一種時變的一維信號,語音聲音信號本身的問題,在於說話人語速、情緒、感官,甚至包括採集音頻的設備、變聲器的應用都會對聲音有一定影響,讓聲音的可信度有存疑;從算法上來說,包括建模、運算的能力,尤其是做聲紋資料庫的時候,去做什麼樣的用戶聲紋驗證,有關年齡、職業分布、發音特質都需要做建模,並且建立資料庫對樣本量的獲取都是難點。

尤其是智能家居大環境下,將會面臨以下幾個方向的挑戰:

首先是噪音的幹擾,也就是魯棒識別(魯棒即經歷了各種信號處理或者各種攻擊後,依然具有一定的保真度),未來將會從算法降噪和硬體降噪來綜合提升體驗;

第二是家居環境下的遠場交互,目前主要是基於理想的家居環境中3~5米的距離來做核心優化,之後會針對於酒店,甚至銀行大廳去做點對點的降噪嘗試;

第三是回聲消除、在設備播放聲音時的喚醒、打斷和交互。最後是提升交互體驗的其他必須技術點,包括聲源定位、聲紋識別等。

相關焦點

  • 拆解報告:Amazon亞馬遜 Echo Show 8帶屏智能音箱
    據調研機構數據顯示,時至今日,亞馬遜Echo系列仍是美國市場最受歡迎的智能音箱,市場佔有率近七成,佔據主導地位。此前我愛音頻網曾經拆解過:Amazon亞馬遜 Echo Show 5智能音箱、亞馬遜Echo Show智能音箱、亞馬遜 echo dot智能音箱三款音箱產品,以及亞馬遜 Echo buds 真無線主動降噪耳機。
  • 詳解亞馬遜Echo智能音箱的幾十種實際用途
    作為智能家居海外欄目,我們今天見識一下智能音箱Echo的「開箱即失」功能。亞馬遜Echo是一款語音交互式藍牙音箱,可以使用內置的Alexa語音交互系統,來同步語音數據、播放音樂和進行智能家居設備控制。2014年亞馬遜Echo誕生時,它並未觸及智能家居領域,2015年4月份新增對Belkin WeMo無線開關和飛利浦Hue燈具的控制之後,Echo才正式觸及智能家居領域。
  • 騰訊安全團隊破解亞馬遜智能音箱Echo,可遠程竊聽並錄音
    北京時間8月13日,在美國拉斯維加斯舉行的第26屆全球黑客大會Defcon上,來自騰訊安全平臺部的Tencent Blade Team,現場演示了如何破解全世界最暢銷的智能音箱——亞馬遜智能音箱Amazon Echo。
  • 與亞馬遜Echo競爭?消息人士透露阿里巴巴正研發中文智能音箱
    (原標題:與亞馬遜Echo競爭?消息人士透露阿里巴巴正研發中文智能音箱) 【TechWeb報導】6月30日消息,據國外媒體報導,消息人士透露阿里巴巴正在研發中文智能音箱,可能就在下周發布。
  • 亞馬遜Echo Spot音箱脫銷
    IT之家12月20日消息 2017年9月27日,在亞馬遜舉行的硬體新品發布會上,圍繞著「Alexa」語音助手平臺,亞馬遜發布Echo、Echo Plus、Echo Spot、Echo Connect和Echo Buttons等多款智能硬體,同時宣布與寶馬汽車合作,2018年「Alexa」語音助手將植入寶馬汽車
  • 世界最受歡迎智能音箱 亞馬遜Echo這麼多型號該怎麼選
    另外,Echo Plus還支持Zegbee平臺,因此能夠成為我們家中最強大的智能控制中心,並且擁有Alexa全部技能。 Zigbee是很多智能設備的連接標準,比如飛利浦Hue智能燈泡,有了Echo Plus,不用再額外購買控制中心,只要將燈泡接入網絡就能直接控制。同時在語音控制方面,Echo Plus的功能也更強大,一切操作都很簡單。
  • 亞馬遜狂發3款新Echo音箱,更小更智能,價格腰斬!
    今天(美國時間9月27日),亞馬遜推出第二代智能音箱Echo和Echo Plus,分別售價99.99美元和149.99美元,折合人民幣約664元與996元,今天開始預訂,10月31日正式發售。此外還有一個售價129.99美元的Echo Spot,可以看作是一個帶屏幕的Echo。
  • 亞馬遜升級Echo軟體 多個智能音箱能當對講機使用
    【TechWeb報導】6月27日消息,據國外媒體報導,如果你家裡有多個亞馬遜Echo設備,它們很快就能當作一個聯網通訊設備來使用。亞馬遜周一推出免費的軟體升級,標準版Echo、Echo Dot和帶屏幕顯示功能的Echo Show均可升級,啟用設備間的通話對講功能。
  • Echo 發出「巫婆笑聲」嚇壞用戶,亞馬遜回應規避了隱私和安全隱憂
    雷鋒網按:亞馬遜的智能助理 Alexa 失控了。近期,很多用戶在 Twitter 上發出了一些關於亞馬遜 Echo 智能音箱的視頻,它內置的語音助手 Alexa 在裡面發出令人毛骨悚然的笑聲。此次事件再一次加劇了人們對於智能音箱在隱私和安全方面的顧慮,不過亞馬遜的回應對此也隻字未提。此前,美國消費者保護組織 Consumer Watchdog 出具了一份報告,通過分析這兩大巨頭的專利申請報告發現,亞馬遜、谷歌等 智能音箱很有可能被用作收集大量信息和廣告推廣的監聽設備。
  • 「百箱大戰」後寒門再難出貴子?中國智能音箱市場攤牌了
    智能音箱的「風」似乎停了,與疫情無關。自亞馬遜Echo帶火智能音箱以來,六年時間,市場從最初的「百箱大戰」到「巨頭稱霸」,操盤手們從盯銷量到看盈利,這個看似「最小」的產品卻在最大的AI市場中馳騁。風停之後看行業格局,回歸到產業趨勢,一切都才剛剛開始。
  • 小度在家智能音箱評測——一個會自己變聰明的音箱
    一直對智能音箱這個品類關注較多,目前智能音箱也已經完全融入了我的生活。大概在1年前,亞馬遜發布了帶屏智能音箱Echo Show,國內智能音箱先行者京東-叮咚也在今年初的CES上發布了帶屏智能音箱 叮咚PLAY,不過實際成為產品並在國內正式上市開賣的倒是今天要體驗的「小度在家」。
  • 亞馬遜剛剛公布了一款亮眼的PRODUCT(RED)Echo音箱
    亞馬遜公布了其最新的Echo智能音箱的全新限量版,PRODUCT(RED)型號承諾將購買者所支付價格的一部分捐給慈善機構。作為回報,買家得到的是比亞馬遜迄今為止提供的其他飾面更鮮豔的智能音箱。不過,在紅色織物外殼內部,還是原來的第四代Echo智能音箱。除此之外還改變了揚聲器的形狀:從粗壯的圓柱體變成了球體,遜增加了雙高音揚聲器以及一個向上發射的低音揚聲器。結果是音質有了明顯的改善。
  • 阿里巴巴開發中文智能語音設備,比拼亞馬遜Echo
    7月3日消息 據外媒neowin報導,中國電商巨頭阿里巴巴正在開發中文版智能語音設備,有望近期面市,與亞馬遜Echo競爭。據悉阿里巴巴的這個新產品將僅在中國推出,且只能講普通話。IT之家中文版智能語音助手能識別中文的語音指令。
  • 智能音箱三國鼎立 亞馬遜、谷歌和蘋果該怎麼選?
    我們的意思是,購買智能音箱不至於讓你太后悔。 目前來看,在市場上已經有各種各樣的智能音箱可以選擇,而且數量正在慢慢增加,但基本上有三大品牌可以看成是主流,分別是亞馬遜、谷歌和蘋果。 你也許會發現市場上還有其他智能音箱並非來自於這三家科技巨頭的,但它們幾乎都將融入了來自於這三家公司的語音助手產品。
  • 智能音箱不智能?我們採訪了這家捧走CES雙獎的AI公司
    當WWDC被網友吐槽像硬體發布會時,CES Asia也被汽車廠商們變成了科技車展。如果要在這兩個大會中找一個關於技術趨勢的最大交集,答案可能是:智能語音的觸角正在攻佔各種各樣的硬體和終端,成為時下最熱門的AI技術之一。這個結論同樣來自與諮詢公司Ovum。據Ovum估計,到2021年,配備智能語音助手的設備數量將增長至75億以上,這一數字甚至略高於目前的世界人口數量。
  • Line 推出智能音箱 Wave,能夠挑戰亞馬遜和谷歌嗎?
    編者按:智能音箱市場上,目前最佔優勢的還是亞馬遜的Alexa,而蘋果和谷歌也不甘示弱,正在發力。韓國著名即時通訊軟體Line也在10月5日全新推出了自家的智能音箱Wave。「關燈,」他對著床邊發光的智能音箱說,這就是Line於10月5日全新推出的智能音箱。另一個場景是:在下班回家的路上,媽媽發來一條信息:「還沒睡覺?」女兒回答說:「Clova,告訴媽媽,爸爸睡著了。」這是Line對其智能音箱Clova Wave的美好願景,它能幫助人們實現無數簡單又暖心的生活場景。
  • 亞馬遜發布兒童版Echo,有多彩外還能教小朋友禮貌用語
    亞馬遜公司又推出了新版Echo智能音箱,不過,這一款Echo將專門針對兒童。從本周三開始,亞馬遜就開始提供這款兒童版智能音箱「Echo Dot Kids Edition」。這款智能音箱配置了彩色耐用的外殼,更為重要的是,還增加了名為「FreeTime」家長控制功能,能夠讓父母更好的幫助孩子使用這款設備。此外,亞馬遜還為這款智能音箱提供了為期兩年的質保服務,而家長控制功能的免費使用期則為一年。這款新版的智能音箱與標準版Echo Dot的內部結構基本相同,售價為80美元。目前,這款設備已經開始接受預訂,將從5月9日開始正式出貨。
  • 索尼松下跟風亞馬遜等巨頭 在IFA2017推出智能音箱
    【TechWeb報導】9月1日消息,據日本媒體報導,配合9月1日在德國柏林開幕的歐洲最大電子消費展會「IFA2017」,索尼和松下在當地發布了智能音箱。索尼智能音箱索尼發布的智能音箱「LF-S50G」除了具備高音質外,還可通過手勢進行操控。在美國的售價為199美元。索尼預計10月在美國投放產品,松下計劃冬季在英國、法國和德國推出。
  • Canalys:全球智能音箱Q3出貨量增44% 亞馬遜是谷歌三倍
    亞馬遜在2019年第三季度出貨了1040萬臺智能音箱,佔本季度市場份額的36.6%,高於2018年第三季度的630萬臺(31.9%)。這使得它遠遠領先於競爭對手谷歌,後者本季度出貨350萬臺設備(佔12.3%市場份額),而2018年第三季度的銷量為590萬臺(29.8%)。
  • 智能音箱或將複製十年前智慧型手機普及神話
    智能音箱或將複製十年前智慧型手機普及神話!百度已與家庭硬體終端廠商小魚在家達成全資收購意向,智能音箱市場或成一家獨大格局。智慧型手機普及於十年前,並延續至今成為工作和生活中不可或缺的物件。區別於3C和傳統智能家電的老成,智能音箱作為新物件上市之後備受關注。一度被預言為下一個智能設備風口的智能音箱,雖被品牌大佬捧在手心,實則又愛又恨。智能音箱市場現已成三分天下,百度收購小魚在家必將打破與天貓和小米的三足鼎立格局,形成一家獨大態勢。當下加速擴張和長期業績虧損聯繫在一起似乎並不搭調,顯然李、馬、雷看中了更大的肥肉。