車載語音越來越好用了,原來背後有這些原因

2020-12-16 騰訊網

不難發現,現在「車載語音交互」的體驗越來越完善。它不僅能完成更多的指令,而且能和我們進行情感交互,甚至還懂得一些基本的倫理綱常。

那現在語音體驗發展到哪一步了?實現這樣的體驗都有哪些路徑?這些路徑之間有什麼不同?為什麼我們的體驗越來越好?下面我們帶著疑惑,一一討論這些問題。

現在的語音系統體驗怎麼好了?

首先語音的基礎能力更強了。

之前雖然能完整跑通 ASR、TTS 這些流程,能實現一些簡單的 NLU/NLP 能力,但體驗有很多漏洞,比如有可能識別失敗,指令完成緩慢,交互邏輯不合常理等等。現在來看,這些基礎能力正變得更強,基本可以稱得上是一個「有價值的工具」。

具體表現有,能夠支持打斷,支持多輪對話,支持上下文理解,支持中英文混合理解,可以自動糾錯,支持免喚醒,誤觸率降低,反應速度增加,能夠識別更輕的聲音,能夠輸入更長的對話,能夠理解一條語音多指令,能夠理解一些普世的倫理邏輯……

說到底這些基礎能力只是一種交互模式,是一種手段,真正要實現價值需要結合應用和生態。所以現在的車載語音還將觸手伸向了更多領域:

1. 將語音和軟體功能結合。比如和作業系統結合,和地圖導航結合,和車機上所有的應用生態結合,和市面上主流的 Feed 流結合。舉個例子,你可以說「屏幕亮一點」,「回到主頁」,「打開 XX 地圖」,「我想聽周杰倫的歌」,「搜索附近的充電站」,「蘋果今天的股價是多少」,「林則徐是誰」等等。和多種應用結合其實是個很大的突破,可以想想,至今 Siri 都不能完成「我要聽 XX 的歌」這樣的指令。

2. 將語音和硬體設備結合。這裡是指控制車內的一些硬體,比如開閉空調、車窗;和其他的智能設備結合,比如車控家,智能手錶等等。

另外近幾年還衍生出了虛擬助手的概念。這對完成指令本身沒有幫助,但在感性層面,它往往非常能打動消費者。一個合適的虛擬形象,往往會成為這套車機系統,甚至這款車的加分項。

同樣的語音體驗

不一樣的實現路徑,不一樣的想像空間

可喜的是,現在確實已經有一部分車型,或完全或部分實現了上面這些功能。但它們的實現路徑其實不太一樣。下面我介紹 3 種。

1. 使用 BAT 的車聯網方案,搭配對應的語音能力。

膚淺來說,現在車機系統最明顯的表現就是搭載各項網際網路應用,比如高德地圖/QQ 音樂/車載微信/愛奇藝等等。所以 BAT 現在都有一套比較通用化的自家生態方案,裡面有不同的功能模塊,OEM 可以選擇「打包上車」,這其中就包括車載語音系統。

自家的生態,配上自家的語音,那肯定體驗會更好一些。拿騰訊來說,他們推出了微信車載版,在騰訊叮噹提供的語音下,我們收發微信語音非常流暢。另外騰訊還有一個產品叫「騰訊隨行」,配合騰訊叮噹收發微信位置,打開小程序,也很流暢。「愛趣聽」也是一樣。

當然,騰訊也會輔助開發系統,給予 Feed 流支持,做一些 NLU 的開發,所以和騰訊合作的車機系統(比如哈弗 F5 搭載的 Fun-Life)基本都能實現我們上面說的那些功能。同理,百度(DuerOS)和阿里(斑馬系統)的方案也可以。

不過,雖然 BAT 都能實現上述功能,但他們還有一個共通點就是基本無法實現「全流程開發」。也就是說車內基礎的 ASR 和 TTS 能力可能是由其他語音供應商提供,而 BAT 負責語音控制生態以及其他相關 NLU 的工作。

當然,這並不是說 BAT 沒有實現 ASR 和 TTS 的能力,據了解有些網際網路大廠已經開始做相關的技術儲備。只是語音交互是一個從前端降噪-語音觸發-識別-理解-語音反饋的長技術鏈,而科大訊飛、思必馳、紐昂司等老牌語音公司,在 ASR 和 TTS 這種基礎語音能力的工程化交付上有更多的經驗,所以大家各司其職,合併合作,其實是更有效率的做法。

2. 不把語音當產品,而把語音當平臺。

我們在《奇妙車機情報局》還測過一個產品,是博泰開發的擎 Mobile。當時確實給到我比較舒適的體驗。(這裡不談論它的產品路徑,只談語音功能的實現。)

它的識別速度很快,糾錯能力較好。可以一邊聽,一邊說,一邊執行命令,還可以隨時打斷。我可以說話聲音很小,也可以說很長一段話。它可以清晰識別,然後摘出長對話裡的多個語音命令。

據了解,如果車載語音僅依靠供應商,那用戶的指令從觸發,到識別,到理解,到反饋,再到執行,是一個脫離的過程,反應時間自然就長。而博泰認為,車載語音不只是一個技術產品,而應該是一個涉及到整車的電子電氣架構、車輛信息安全以及車輛數據閉環的「平臺」。

所以擎 Mobile 是一套集成了晶片、硬體、軟體、雲端和生態的平臺化產品。

以導航功能為例,它會在識別指令的同時,直接抓取關鍵字上傳到地圖引擎。比如我說「導航到北京機場 T3 航站樓的停車場接個人」,關鍵詞是北京、T3、停車場。關鍵詞抓完,導航實施執行。所以有可能我話沒說完,雲端已經開始計算執行了。這是集成的好處。

當然這個產品也並不完美,在我當時的體驗下,雖然語音有很極致的體驗,但它和其他應用生態的結合和適配比較一般。另外未來博泰如何把相關能力輸出給 OEM,我也暫時打個問號。

3. 自己定義語音交互框架。

近期小鵬汽車的新車型 P7 火了(不是著火了),最亮眼的部分之一就是它的車載語音。

識別速度很快,功能結合深入,對話邏輯自然幽默,語音助手的新形象也更高級了一些,而且語音反饋的女聲實在是很甜美。這其實能表明,AISpeech 和 Xpeng in House 把 ASR 做的紮實,TTS 優化地好,NLU 也做了比較深刻的訓練。

值得一提的是,P7 的語音交互框架是小鵬自己搭建的,所以它也不只是個簡單的產品,而是個平臺。它可以在初期就構建很多深層的功能,讓車內的數據聯動起來,同時對數據安全和用戶隱私進行保護和封鎖。也正因為功能是自己定義的,所以用戶數據自然也就跑到自家口袋裡來,這就讓運營用戶成為可能。

相對 BAT 提供的語音能力,小鵬汽車有完全自主的產品定義權;相對博泰,小鵬汽車有產品做支撐。P7 的語音系統確實是一個佔優勢的產品。

另外,再說說說自己搭建語音交互框架有多重要。我舉個反例。近期我們體驗了一套傳統豪華品牌下全新換代車型的車機系統。這套語音系統的框架是德國定義的,語音供應商分別有兩家,一家是紐昂司,一家是國內供應商(我們暫且稱它為 XX),同時它還接入了天貓精靈的能力。

紐昂司和 XX 都承擔了 ASR 和 NLU 的任務,算是並行關係,所以用戶輸入任何一個指令,這倆通道都要跑一遍,最後它倆統一口徑實行指令。一旦誰慢了,就要互相等著,所以這套語音的執行速度較慢。而且它的 TTS 有拖音現象,據說是歷史遺留問題,是上代車型上的老方案,所以只能如此。再說天貓精靈,它並不會自然喚醒,而是你要對喚醒的語音說一句「你好,天貓精靈」,它才會出現。

這麼看來,這個語音交互框架是挺亂的,但大廠認可自己的節奏就行。而且倒也不是說要一味的激進,因為不是每個大刀闊斧的產品都是成功的。所以,激進還是保守,後果都要自己承擔。

為什麼現在的車載語音系統變得好用了?

車載語音的完善,供應商和 OEM 都做出了努力。

從供應商方面來說,早期的語音供應商並沒有開箱即用的語音方案,都需要大量對接、磨合。現在各家方案在工程化上解決問題越來越多,實用性也就越來越好。具體表現就是各個技術環節的指標都有量的提升(這裡包括抗噪、識別、理解)。

在 OEM 方面來說,語音的交互框架更完善,從以前的單工單輪交互逐漸往多輪連續對話能力升級,對話更自由;NLU 的泛化支持更充分,語音識別更準,對話邏輯更自然;功能應用更豐富,更實用,語音和各功能的融合更深入。

簡單來說,軟硬體技術的升級,讓機器能聽清我們說什麼;更豐富的語料和更完善的語音模型,讓我們能聽清機器說什麼;同時上車的功能更多更實用,能滿足我們更多車內的需求。以上。

總結

談起語音進入汽車,可能要追溯到 10 年前。如今 2020 年了,車內語音交互終於讓我們感受到了進步。

上面我們談到現在的語音交互如何好用,實現路徑有幾種,也分析了背後的原因。這是每家供應商在推著行業往前走,也是每個車廠自己的選擇和節奏。也許有些路是走彎了,甚至走錯了,但好的方面是,汽車配置的越來越下沉,用戶能用更合理的錢獲得更好的體驗。

最後來思考一個顛覆問題:語音交互一定是車內最好的交互方式嗎?如果不是,那上述話題就意義不大了。事實上,我們確實在一邊大力發展語音交互同時,一邊尋找新的交互方式。

相關焦點

  • 想要改裝車載安卓屏幕?這些應該先搞懂!
    隨著汽車技術的快速發展,越來越多的高科技配置不斷湧現,車聯網、語音控制、自動泊車、車載無線Wifi等,令消費者眼花繚亂。可這些高科技配置大部分都需要一個載體,那就是中控顯示屏。沒有這項配置的話,很多非常方便的功能都無法使用,比如倒車影像。所以,近些年來人們在購車時,大尺寸的中控屏已經成為了大家關注的焦點。
  • 曾國藩每遇小人時,就用鬼谷子這3句話警戒自己,變得越來越好!
    就像人們經常說的防人之心不可無,害人之心不可有。可能會因為一件小事,最後演變成一件大事,搞得以悲劇收場的真的是讓人非常的寒心。但是我們最害怕的是遇到那種社會上的小人,無論是在什麼時候,他都會背後給你一刀防不勝防。
  • 影響你人際關係越來越好的3個原因,別再滿不在乎了
    當你覺得在人際關係上,越來越被冷落的時候,很有可能是以下三個原因引起的。或許你會說,誰還沒有在人際關係上遇到點兒小麻煩啊,不就是被冷落嘛,沒有必要那麼緊張,大驚小怪吧!其實還真別說,如果你不注意這些原因,就一定會讓自己的人際關係變得越來越差,到時候你想再做出挽救,可能就沒有那麼輕鬆了吧!
  • 人緣越來越好的姑娘,通常都有三種「軟實力」,你學會了嗎?
    也只有這種真正人品好的姑娘,才不難有個好人緣。在現實生活中,那些人緣越來越好的姑娘,通常都有三種「軟實力」,你學會了嗎?01心態平和,平易近人人緣好的姑娘,通常都心態平和,她們深知人言可畏,所以才不會在背後議論他人,心態平和,始終保持寵辱不驚。這種女人在與人交往時,很少抬高自己,也很少議論別人。
  • 網友:娘家越來越好,哥哥的生意也越來越好
    我媽照顧的我,當年我爸生病手術,一年後我奶奶去世,但這些可不關我事,我爸病都好多年了!只是更嚴重了!這個是他病了不看醫生的後果,我奶奶是老了!我爸手術的時候,大家都去外地大醫院了!只有我一個人帶孩子,還要一個人照顧我病榻上的奶奶,我問心無愧。半夜睡,早起做飯,餵飯!真的問心無愧!
  • 百度輸入法洞察用戶需求,升級四大功能,真的是越來越好用了
    當前合流的輸入法有百度輸入法、搜狗輸入法以及訊飛輸入法三個,他們劃分佔有著國內環境趨向的絕大片面環境趨向。而在這三大輸入法中百度輸入法的前進短長常迅速的,由於百度輸入法明白洞察用戶的需要,並且踴躍改善。
  • 大眾有家電互聯,自主可「思考」,原來車載系統已這麼先進
    上汽大眾:車載系統加入移動在線服務買車君曾經試駕過大眾系的車型,發現其搭載的車機系統確實與自主品牌有不小的差距。不過,在剛上市不久的2020款帕薩特上,新的車載系統卻令人刮目相看。它的存在,給用戶帶來了海量的應用,同時又不會使車載系統變卡,一舉兩得。可以發現,Fun-Life系統已經在功能多的前提下,進一步提升了好用的程度,無論是語音交互還是影音享受,都力求給用戶最好最穩定的體驗。總之,一套好的車機系統,能夠讓用戶不再掏出手機,Fun-Life顯然就是這一類。
  • 一個家有這四個徵兆,往往會越來越好
    的確如此,不幸的家庭中,會有種種的原因,幸福的家庭中,卻會有相似的智慧,比如下面這四個跡象:01大事商量長久以往,一個家會越來越好。而且,如果你是極其看重這些事的人,那可以換個方式溝通呀,用生氣和記仇的方式,是起不到多少作用的。只能讓兩個人的關係越來越差。婚姻是要用智慧去經營的,感覺到對方做了讓自己不舒服的時候,是要做有效的溝通,而不是用情緒來對抗,這樣,一個家會越來越好。
  • 有了它 車載音箱秒變藍牙車載音響
    車載聽音樂,你還在用vcd碟片、優盤嗎?反正我是實不用了!那麼,用什麼播放器呢?手機+藍牙是我最喜歡的方式!原因,很簡單,隨著運營商流量資費的降低,一些網絡流量卡的盛行,每個月我們的流量基本充足。包裝就不展示了,直接來張全家福,從左至右圓形3m固定車載底座、車載出風口夾、車載藍牙接收器,以及說明書保修卡。線纜比較長,總長將近180cm,3.5mm音頻線與USB線45cm!綠聯車載藍牙接收器是直徑為5cm的圓柱形,周圍黑色拋光,正面是灰色塑膠材質,麥克風、綠聯標識,中間有話筒標識的是多功能按鍵,可以開關機、可以接聽拒聽電話等等功能;邊上是音量加減,選曲按鍵。
  • 能夠越來越好,也會越好越來.
    行之以推己及人且感同身受,乃是良性換位思考與互動的核心邏輯;——使雙方都明白為何與如何同對方打交道,乃是良性換位思考與互動的努力方向;——首信人而後得人之信、首利人而後蒙人之利、首讓人而後求人之讓,乃是良性換位思考與互動的基本原則;——期待與被期待相吸、引導與被引導相向、回饋與被回饋相益、激發與被激發相促,乃是良性換位思考與互動的主要方式;——越來越好
  • 女人為什麼變得越來越好強,主要有這三個原因
    現在看到很多女強人,她們在家裡能相夫教子,在外面工作起來雷厲風行,工作起來像一陣風,一般她們的老公都在一個風平浪靜的工作崗位上工作,但這些女人,她們卻打理起自己的事業,自有一番作為,在工作上她們不亞於男人。現在的女人為什麼變得越來越好強,主要有這三個原因,你知道嗎?
  • 那些活得越來越好的女人,大多數都有這些特徵,希望其中有你!
    那些活得越來越好的女人,大多數都有這些特徵,希望其中有你! 確實,每一個人的幸福都掌握在自己手中,你若是想要越活越好,活出屬於自己的精彩,那麼,你首先就要獨立自主,要有屬於自己的經濟來源,這樣你才不至於依附於男人,你想買什麼就買什麼,沒有人會幹涉你。
  • 無需專業拆裝,輕鬆實現車載藍牙音響智能語音操控
    隨著AI智能語音技術的不斷發展,語音控制正在逐漸的融入我們的生活。前段時間朋友買了一輛新車,除了可以用語音進行多媒體點播,同時還能實現語音開啟天窗,空調等系列操作。而筆者的車只是一輛麵包工具車,雖然車子的檔次太低,但是由於筆者對數碼產品的興趣,先後自己加裝了車載藍牙、行車記錄儀等設備。雖然加了車載藍牙,可以用手機連接車載音箱聽歌,但是通話,選歌或者導航都需要在手機上操作,相比於語音點播來說不僅不方便,而且不利於行車安全。
  • 屈臣氏有款「平價」精華,良心又好用!用後皮膚越來越好了!
    屈臣氏有款「平價」精華,良心又好用!用後皮膚越來越好了!如果說能夠擁有一副白到發光的皮膚的話,那一定是很多小仙女的願望了。相信很多小姐妹們在美白這條路上使用過很多的產品,很多人都熱衷於一些歐美的大牌產品,其實呢這些年國貨也在慢慢的崛起。
  • 手機導航與車載導航哪個更好用?
    隨著技術的發展與應用,車載導航不再是高端車型獨有的配置了,很多中端車型,甚至低端車型也紛紛配備了車載導航,讓我們告別了「盲走」時代。車載導航市場方興未艾的時候,手機導航的出現,讓我們有了另一個選擇。手機的發展促進了手機導航的發展,目前手機導航的普及讓車載導航的處境十分尷尬,那麼造成這個局面的原因是什麼呢?
  • 真正能用的車載系統什麼樣?深度體驗斑馬智行系統!
    近幾年各大車企都在「智能互聯」上下功夫,最直觀的就是「用觸控、換大屏」,但與之同時,身邊許多人開著搭載大屏的車時依然在用手機導航、聽手機裡的歌,問其原因,「不好用」是聽的最多的一個回答,各種各樣的「不方便」和「太麻煩」影響了他們的使用體驗,那麼市場上的這些「大屏」到底是剛需還是噱頭?有沒有好用的呢?我們今後會陸續給大家一一測試,今天我們就先來測試一下名頭非常響的榮威斑馬智行系統。
  • 積極融入集體,胡梅爾斯:桑謝斯的德語英語越來越好
    今天,《圖片報》撰文揭示了桑謝斯狀態復甦背後的細節。在對陣本菲卡的比賽結束後,拜仁主管薩利哈米季奇對桑謝斯大加讚賞,他表示如果延續這樣的狀態,這位小將將成為拜仁不可或缺的一員,並有望成為世界頂尖球員。《圖片報》透露,桑謝斯初到拜仁還有很多不適應,現在他努力融入球隊中,積極學習德語,雖然德語對他來說仍然很有難度,但他已經能夠更深入地理解了。
  • 祝祖國越來越好
    7 時整,五星紅旗升上了旗杆頂端,人群中響起掌聲和歡呼聲,「祝祖國越來越好!祝成都越來越好!」  四川大學錦城學院50多名大一、大二學生「組團」前來看升旗。升國旗儀式結束後,同學們在廣場上合影,高呼:「2019,我和我的祖國一起奔跑。」  唐子晴本報記者郝勇 郝飛 攝影報導
  • 都說農村戶口越來越好,但農民還是進城買房或轉戶口,為啥?
    農村越來越好,為何還去城市買房或者轉戶口?也可以這麼說,大家都說農村生活越來越好,農村生活令人嚮往,農村有大面積的四合院,為什麼農民努力奮鬥還是想在城市買套樓房?背後原因令人心酸!說白了,都是不得已而為之!
  • 反思力:學習越來越好的關鍵
    特別是失敗、挫折的時候,如果將時間用在自怨自艾,而不去反省自己,那麼錯誤就是一個負擔。相反,如果能沉下心去挖掘失敗的原因,避免下一次再犯同樣的錯誤。那麼這樣的失敗,再來幾次都不怕。所謂屢戰屢敗,屢敗屢戰,重整旗鼓之後,能發揮出更強大的實力。我從小學開始,就有不犯同樣錯誤的習慣。隨著年齡漸長,我發現這是個拉開差距的重要因素。