作者:舊叔
ID:jiushujiuwen
作為一名用戶,舊叔主觀覺得語音助手這東西越來越雞肋了。
算一算我幾乎已經把市面上保有量比較高的手機和智能音箱產品用了個遍,iPhone、華為、小米、OV、一加、360、聯想、Google Nexus、索尼、天貓精靈、小度音箱、小愛音箱......作為一名數碼發燒友,以上所有的硬體產品在入手不到一個月的時間裡,在我手裡都會淪為「智能鬧鐘」,因為只有在設置鬧鐘的時候,才能感受到它的智能和存在。
也許還偶爾會讓語音助手們「播放一下今天的新聞」、「查看一下今天的天氣」、「找一首歌」、「搜索一個名詞」什麼的,但說實話,這類用途更多的是作為節省時間的選項,頻次不高且雞肋,你要正兒八經的說它是「助手」,我是不承認的。
語音助手產品們在很多年前剛開始火爆時給到的標準體驗場景就是「解放雙手」,可經過了那麼多年的發展,Siri「半死不活」,各大手機廠商紛紛跟進的各類語音助手產品雖不時有「微創新」,但離真的解放雙手還有十萬八千裡。
以Siri為例,近些年除了言語調戲一下「享受」它偶發的抖機靈,我們還能記得個啥?一度大家只能傻傻地長按home鍵展開與它「弱智」一般的對話,還得大聲嚷嚷生怕Siri一個走神就聽不到你在說什麼。
近年Siri倒是可以不按鍵喚醒了,可是識別率十分堪憂,就算好不容易喚醒了,你還得繼續忍受它莫名其面的語義識別和幾乎完全不能實現複雜操作的雞肋功能。可能是因為對國內市場的不重視吧,Siri升級了很多次,但在國內依然擺脫不了「智障」之名。
各大國產手機廠商的語音助手們也好不到哪裡去。小米的小愛同學、華為的HiAssistant、VIVO的Jovi、OPPO的Breeno......大家在搭建自有智能語音平臺上的激情顯然沒有把這些語音助手做好的激情要高。
以近幾個月最新發布的OPPO人工智慧語音助手Breeno平臺為例,作為當時OPPO Reno手機發布時OPPO方面重點推介的附加功能,Breeno除了在剛發布時有點聲音,現在幾乎已經銷聲匿跡。
我們可以把Breeno理解為目前國內手機大廠針對語音助手產品的集大成之作,因為它號稱針對該產品設置了「空間、建議、識物、識屏、語音、駕駛、速覽七大功能模塊」,能夠實現在「超多」場景下的智能感知體系和自然語音交互的智能助理功能。
你看,識屏、識物這些熱門AI領域的應用都被加上來了,智能語音助手看起來似乎已經發展的很成熟?
扯淡。在Breeno的宣傳片裡,它的遠景是:用戶可以通過Breeno輕鬆一掃,「了解博物館裡藝術畫作的年代、背景信息」;可以在看到朋友圈裡曬的好看衣服的同時,問Breeno「這個多少錢?」,就可以通過Breeno的語音識別以及圖片識別獲得想要的答案;用戶也可以在開車時說一句「Hi, Breeno,為我讀簡訊」,就能讓手機為你自動讀出手機信息。
說實話,這些功能體驗誇張點來說似乎是十年前的產物,第一代語音識別產品在手機上出現的時候,暢想的功能體驗比這還多。難道語音助手在手機或智能音箱等產品上的應用這些年就沒什麼進步嗎?
一方面,這些系統「預設」的功能的確是可以實現,但也僅限於這些看似亮點的預設功能,稍微超綱或複雜點,語音助手可能壓根就理解不了你的意思,更別談完成指令了;另一方面,語音助手產品目前完全離不開「動手」操作,基本喚醒和語義識別在實際現實嘈雜環境中的體驗非常差,進一步的識別後操作更是有很多的硬體、軟體壁壘。
也就是說,目前所有的智能語音助手其實都一點也不「智能」,它頂多能實現比如「給小張發送 88 塊錢微信紅包並備註生日快樂」這類看起來含有多層操作路徑的偽複雜功能,或是像小愛同學這樣聯動旗下智能硬體生態鏈產品的簡單操作,但前提仍然是廠家預設了相關邏輯,稍微超綱或超出語義範圍它就會繼續淪為「對牛彈琴」的小白。
智能語音識別「智障」的一面我們已經見識的很多了,那麼多年來,智能語音助手只能寄希望於手機廠商定時更新推出的一些亮點新功能,在新奇期過去後,它們就會繼續變成「語音鬧鐘」。
當然各手機廠商們已經很努力了——比如現在小愛同學和 Jovi 已經可以支持應用內「點擊」以及「文本輸入」這兩種類型的教學,通過這種途徑可以滿足很多 App 內的操作方式,通過語音打開任意某某軟體進行點擊或輸入操作已經不是夢。小愛同學還可以控制與它連接的更多場景的智能家電操作;Bixby 能在你說「將鎖屏時間設置到10分鐘」這樣非常少見的操作時自動幫你調整好鎖屏時間;Jovi可以幫你找出「最近的一條簡訊」; 小愛同學、華為 HiAssistant、Bixby、Jovi 可以通過語音調用自帶的「智能識圖」功能,實現智能翻譯、智能識物、智能掃碼等功能。
但這些功能只能說是「可以實現」,附帶的條件或者使用的場景要求非常嚴苛,在用戶只能按照語音助手預設的功能進行操作的情況下,我們對這些看起來複雜一些的功能的使用頻率非常低,使用的感受也不好。
說到底,作為智能語音助手產品需要解決的核心問題是:不僅僅是充當「一觸即發」的語音開關,還要能夠智能學習舉一反三,將涵蓋更多複雜操作的「工作流」應用在更多的手機操作、智慧互聯場景下。
從這個維度來講,目前市面上所有的智能語音助手產品鏈第一步「一觸即發」這樣的功能點都沒有做好,就更別談後續的創新了。
智能語音助手產品越來越像是一種「偽需求」,它在很長一段時間裡只能當成「玩具」和廠家宣傳的「噱頭」,離真正的高頻使用「助手」產品還差一次「技術革命」。