車載語音越來越好用了,原來背後有這些原因

2020-12-16 騰訊網

不難發現，現在「車載語音交互」的體驗越來越完善。它不僅能完成更多的指令，而且能和我們進行情感交互，甚至還懂得一些基本的倫理綱常。

那現在語音體驗發展到哪一步了？實現這樣的體驗都有哪些路徑？這些路徑之間有什麼不同？為什麼我們的體驗越來越好？下面我們帶著疑惑，一一討論這些問題。

現在的語音系統體驗怎麼好了？

首先語音的基礎能力更強了。

之前雖然能完整跑通 ASR、TTS 這些流程，能實現一些簡單的 NLU/NLP 能力，但體驗有很多漏洞，比如有可能識別失敗，指令完成緩慢，交互邏輯不合常理等等。現在來看，這些基礎能力正變得更強，基本可以稱得上是一個「有價值的工具」。

具體表現有，能夠支持打斷，支持多輪對話，支持上下文理解，支持中英文混合理解，可以自動糾錯，支持免喚醒，誤觸率降低，反應速度增加，能夠識別更輕的聲音，能夠輸入更長的對話，能夠理解一條語音多指令，能夠理解一些普世的倫理邏輯……

說到底這些基礎能力只是一種交互模式，是一種手段，真正要實現價值需要結合應用和生態。所以現在的車載語音還將觸手伸向了更多領域：

1. 將語音和軟體功能結合。比如和作業系統結合，和地圖導航結合，和車機上所有的應用生態結合，和市面上主流的 Feed 流結合。舉個例子，你可以說「屏幕亮一點」，「回到主頁」，「打開 XX 地圖」，「我想聽周杰倫的歌」，「搜索附近的充電站」，「蘋果今天的股價是多少」，「林則徐是誰」等等。和多種應用結合其實是個很大的突破，可以想想，至今 Siri 都不能完成「我要聽 XX 的歌」這樣的指令。

2. 將語音和硬體設備結合。這裡是指控制車內的一些硬體，比如開閉空調、車窗；和其他的智能設備結合，比如車控家，智能手錶等等。

另外近幾年還衍生出了虛擬助手的概念。這對完成指令本身沒有幫助，但在感性層面，它往往非常能打動消費者。一個合適的虛擬形象，往往會成為這套車機系統，甚至這款車的加分項。

同樣的語音體驗

不一樣的實現路徑，不一樣的想像空間

可喜的是，現在確實已經有一部分車型，或完全或部分實現了上面這些功能。但它們的實現路徑其實不太一樣。下面我介紹 3 種。

1. 使用 BAT 的車聯網方案，搭配對應的語音能力。

膚淺來說，現在車機系統最明顯的表現就是搭載各項網際網路應用，比如高德地圖/QQ 音樂/車載微信/愛奇藝等等。所以 BAT 現在都有一套比較通用化的自家生態方案，裡面有不同的功能模塊，OEM 可以選擇「打包上車」，這其中就包括車載語音系統。

自家的生態，配上自家的語音，那肯定體驗會更好一些。拿騰訊來說，他們推出了微信車載版，在騰訊叮噹提供的語音下，我們收發微信語音非常流暢。另外騰訊還有一個產品叫「騰訊隨行」，配合騰訊叮噹收發微信位置，打開小程序，也很流暢。「愛趣聽」也是一樣。

當然，騰訊也會輔助開發系統，給予 Feed 流支持，做一些 NLU 的開發，所以和騰訊合作的車機系統（比如哈弗 F5 搭載的 Fun-Life）基本都能實現我們上面說的那些功能。同理，百度（DuerOS）和阿里（斑馬系統）的方案也可以。

不過，雖然 BAT 都能實現上述功能，但他們還有一個共通點就是基本無法實現「全流程開發」。也就是說車內基礎的 ASR 和 TTS 能力可能是由其他語音供應商提供，而 BAT 負責語音控制生態以及其他相關 NLU 的工作。

當然，這並不是說 BAT 沒有實現 ASR 和 TTS 的能力，據了解有些網際網路大廠已經開始做相關的技術儲備。只是語音交互是一個從前端降噪-語音觸發-識別-理解-語音反饋的長技術鏈，而科大訊飛、思必馳、紐昂司等老牌語音公司，在 ASR 和 TTS 這種基礎語音能力的工程化交付上有更多的經驗，所以大家各司其職，合併合作，其實是更有效率的做法。

2. 不把語音當產品，而把語音當平臺。

我們在《奇妙車機情報局》還測過一個產品，是博泰開發的擎 Mobile。當時確實給到我比較舒適的體驗。（這裡不談論它的產品路徑，只談語音功能的實現。）

它的識別速度很快，糾錯能力較好。可以一邊聽，一邊說，一邊執行命令，還可以隨時打斷。我可以說話聲音很小，也可以說很長一段話。它可以清晰識別，然後摘出長對話裡的多個語音命令。

據了解，如果車載語音僅依靠供應商，那用戶的指令從觸發，到識別，到理解，到反饋，再到執行，是一個脫離的過程，反應時間自然就長。而博泰認為，車載語音不只是一個技術產品，而應該是一個涉及到整車的電子電氣架構、車輛信息安全以及車輛數據閉環的「平臺」。

所以擎 Mobile 是一套集成了晶片、硬體、軟體、雲端和生態的平臺化產品。

以導航功能為例，它會在識別指令的同時，直接抓取關鍵字上傳到地圖引擎。比如我說「導航到北京機場 T3 航站樓的停車場接個人」，關鍵詞是北京、T3、停車場。關鍵詞抓完，導航實施執行。所以有可能我話沒說完，雲端已經開始計算執行了。這是集成的好處。

當然這個產品也並不完美，在我當時的體驗下，雖然語音有很極致的體驗，但它和其他應用生態的結合和適配比較一般。另外未來博泰如何把相關能力輸出給 OEM，我也暫時打個問號。

3. 自己定義語音交互框架。

近期小鵬汽車的新車型 P7 火了（不是著火了），最亮眼的部分之一就是它的車載語音。

識別速度很快，功能結合深入，對話邏輯自然幽默，語音助手的新形象也更高級了一些，而且語音反饋的女聲實在是很甜美。這其實能表明，AISpeech 和 Xpeng in House 把 ASR 做的紮實，TTS 優化地好，NLU 也做了比較深刻的訓練。

值得一提的是，P7 的語音交互框架是小鵬自己搭建的，所以它也不只是個簡單的產品，而是個平臺。它可以在初期就構建很多深層的功能，讓車內的數據聯動起來，同時對數據安全和用戶隱私進行保護和封鎖。也正因為功能是自己定義的，所以用戶數據自然也就跑到自家口袋裡來，這就讓運營用戶成為可能。

相對 BAT 提供的語音能力，小鵬汽車有完全自主的產品定義權；相對博泰，小鵬汽車有產品做支撐。P7 的語音系統確實是一個佔優勢的產品。

另外，再說說說自己搭建語音交互框架有多重要。我舉個反例。近期我們體驗了一套傳統豪華品牌下全新換代車型的車機系統。這套語音系統的框架是德國定義的，語音供應商分別有兩家，一家是紐昂司，一家是國內供應商（我們暫且稱它為 XX），同時它還接入了天貓精靈的能力。

紐昂司和 XX 都承擔了 ASR 和 NLU 的任務，算是並行關係，所以用戶輸入任何一個指令，這倆通道都要跑一遍，最後它倆統一口徑實行指令。一旦誰慢了，就要互相等著，所以這套語音的執行速度較慢。而且它的 TTS 有拖音現象，據說是歷史遺留問題，是上代車型上的老方案，所以只能如此。再說天貓精靈，它並不會自然喚醒，而是你要對喚醒的語音說一句「你好，天貓精靈」，它才會出現。

這麼看來，這個語音交互框架是挺亂的，但大廠認可自己的節奏就行。而且倒也不是說要一味的激進，因為不是每個大刀闊斧的產品都是成功的。所以，激進還是保守，後果都要自己承擔。

為什麼現在的車載語音系統變得好用了？

車載語音的完善，供應商和 OEM 都做出了努力。

從供應商方面來說，早期的語音供應商並沒有開箱即用的語音方案，都需要大量對接、磨合。現在各家方案在工程化上解決問題越來越多，實用性也就越來越好。具體表現就是各個技術環節的指標都有量的提升（這裡包括抗噪、識別、理解）。

在 OEM 方面來說，語音的交互框架更完善，從以前的單工單輪交互逐漸往多輪連續對話能力升級，對話更自由；NLU 的泛化支持更充分，語音識別更準，對話邏輯更自然；功能應用更豐富，更實用，語音和各功能的融合更深入。

簡單來說，軟硬體技術的升級，讓機器能聽清我們說什麼；更豐富的語料和更完善的語音模型，讓我們能聽清機器說什麼；同時上車的功能更多更實用，能滿足我們更多車內的需求。以上。

總結

談起語音進入汽車，可能要追溯到 10 年前。如今 2020 年了，車內語音交互終於讓我們感受到了進步。

上面我們談到現在的語音交互如何好用，實現路徑有幾種，也分析了背後的原因。這是每家供應商在推著行業往前走，也是每個車廠自己的選擇和節奏。也許有些路是走彎了，甚至走錯了，但好的方面是，汽車配置的越來越下沉，用戶能用更合理的錢獲得更好的體驗。

最後來思考一個顛覆問題：語音交互一定是車內最好的交互方式嗎？如果不是，那上述話題就意義不大了。事實上，我們確實在一邊大力發展語音交互同時，一邊尋找新的交互方式。

相關焦點

想要改裝車載安卓屏幕?這些應該先搞懂!

隨著汽車技術的快速發展，越來越多的高科技配置不斷湧現，車聯網、語音控制、自動泊車、車載無線Wifi等，令消費者眼花繚亂。可這些高科技配置大部分都需要一個載體，那就是中控顯示屏。沒有這項配置的話，很多非常方便的功能都無法使用，比如倒車影像。所以，近些年來人們在購車時，大尺寸的中控屏已經成為了大家關注的焦點。
曾國藩每遇小人時,就用鬼谷子這3句話警戒自己,變得越來越好!

就像人們經常說的防人之心不可無，害人之心不可有。可能會因為一件小事，最後演變成一件大事，搞得以悲劇收場的真的是讓人非常的寒心。但是我們最害怕的是遇到那種社會上的小人，無論是在什麼時候，他都會背後給你一刀防不勝防。
影響你人際關係越來越好的3個原因，別再滿不在乎了

當你覺得在人際關係上，越來越被冷落的時候，很有可能是以下三個原因引起的。或許你會說，誰還沒有在人際關係上遇到點兒小麻煩啊，不就是被冷落嘛，沒有必要那麼緊張，大驚小怪吧！其實還真別說，如果你不注意這些原因，就一定會讓自己的人際關係變得越來越差，到時候你想再做出挽救，可能就沒有那麼輕鬆了吧！
人緣越來越好的姑娘,通常都有三種「軟實力」,你學會了嗎?

也只有這種真正人品好的姑娘，才不難有個好人緣。在現實生活中，那些人緣越來越好的姑娘，通常都有三種「軟實力」，你學會了嗎？01心態平和，平易近人人緣好的姑娘，通常都心態平和，她們深知人言可畏，所以才不會在背後議論他人，心態平和，始終保持寵辱不驚。這種女人在與人交往時，很少抬高自己，也很少議論別人。
網友:娘家越來越好,哥哥的生意也越來越好

我媽照顧的我，當年我爸生病手術，一年後我奶奶去世，但這些可不關我事，我爸病都好多年了！只是更嚴重了！這個是他病了不看醫生的後果，我奶奶是老了！我爸手術的時候，大家都去外地大醫院了！只有我一個人帶孩子，還要一個人照顧我病榻上的奶奶，我問心無愧。半夜睡，早起做飯，餵飯！真的問心無愧！
百度輸入法洞察用戶需求,升級四大功能,真的是越來越好用了

當前合流的輸入法有百度輸入法、搜狗輸入法以及訊飛輸入法三個，他們劃分佔有著國內環境趨向的絕大片面環境趨向。而在這三大輸入法中百度輸入法的前進短長常迅速的，由於百度輸入法明白洞察用戶的需要，並且踴躍改善。
大眾有家電互聯,自主可「思考」,原來車載系統已這麼先進

上汽大眾：車載系統加入移動在線服務買車君曾經試駕過大眾系的車型，發現其搭載的車機系統確實與自主品牌有不小的差距。不過，在剛上市不久的2020款帕薩特上，新的車載系統卻令人刮目相看。它的存在，給用戶帶來了海量的應用，同時又不會使車載系統變卡，一舉兩得。可以發現，Fun-Life系統已經在功能多的前提下，進一步提升了好用的程度，無論是語音交互還是影音享受，都力求給用戶最好最穩定的體驗。總之，一套好的車機系統，能夠讓用戶不再掏出手機，Fun-Life顯然就是這一類。
一個家有這四個徵兆,往往會越來越好

的確如此，不幸的家庭中，會有種種的原因，幸福的家庭中，卻會有相似的智慧，比如下面這四個跡象：01大事商量長久以往，一個家會越來越好。而且，如果你是極其看重這些事的人，那可以換個方式溝通呀，用生氣和記仇的方式，是起不到多少作用的。只能讓兩個人的關係越來越差。婚姻是要用智慧去經營的，感覺到對方做了讓自己不舒服的時候，是要做有效的溝通，而不是用情緒來對抗，這樣，一個家會越來越好。
有了它車載音箱秒變藍牙車載音響

車載聽音樂，你還在用vcd碟片、優盤嗎？反正我是實不用了！那麼，用什麼播放器呢？手機+藍牙是我最喜歡的方式！原因，很簡單，隨著運營商流量資費的降低，一些網絡流量卡的盛行，每個月我們的流量基本充足。包裝就不展示了，直接來張全家福，從左至右圓形3m固定車載底座、車載出風口夾、車載藍牙接收器，以及說明書保修卡。線纜比較長，總長將近180cm，3.5mm音頻線與USB線45cm！綠聯車載藍牙接收器是直徑為5cm的圓柱形，周圍黑色拋光，正面是灰色塑膠材質，麥克風、綠聯標識，中間有話筒標識的是多功能按鍵，可以開關機、可以接聽拒聽電話等等功能；邊上是音量加減，選曲按鍵。
能夠越來越好,也會越好越來.

行之以推己及人且感同身受，乃是良性換位思考與互動的核心邏輯；——使雙方都明白為何與如何同對方打交道，乃是良性換位思考與互動的努力方向；——首信人而後得人之信、首利人而後蒙人之利、首讓人而後求人之讓，乃是良性換位思考與互動的基本原則；——期待與被期待相吸、引導與被引導相向、回饋與被回饋相益、激發與被激發相促，乃是良性換位思考與互動的主要方式；——越來越好
女人為什麼變得越來越好強,主要有這三個原因

現在看到很多女強人，她們在家裡能相夫教子，在外面工作起來雷厲風行，工作起來像一陣風，一般她們的老公都在一個風平浪靜的工作崗位上工作，但這些女人，她們卻打理起自己的事業，自有一番作為，在工作上她們不亞於男人。現在的女人為什麼變得越來越好強，主要有這三個原因，你知道嗎？
那些活得越來越好的女人,大多數都有這些特徵,希望其中有你!

那些活得越來越好的女人，大多數都有這些特徵，希望其中有你！確實，每一個人的幸福都掌握在自己手中，你若是想要越活越好，活出屬於自己的精彩，那麼，你首先就要獨立自主，要有屬於自己的經濟來源，這樣你才不至於依附於男人，你想買什麼就買什麼，沒有人會幹涉你。
無需專業拆裝,輕鬆實現車載藍牙音響智能語音操控

隨著AI智能語音技術的不斷發展，語音控制正在逐漸的融入我們的生活。前段時間朋友買了一輛新車，除了可以用語音進行多媒體點播，同時還能實現語音開啟天窗，空調等系列操作。而筆者的車只是一輛麵包工具車，雖然車子的檔次太低，但是由於筆者對數碼產品的興趣，先後自己加裝了車載藍牙、行車記錄儀等設備。雖然加了車載藍牙，可以用手機連接車載音箱聽歌，但是通話，選歌或者導航都需要在手機上操作，相比於語音點播來說不僅不方便，而且不利於行車安全。
屈臣氏有款「平價」精華,良心又好用!用後皮膚越來越好了!

屈臣氏有款「平價」精華，良心又好用！用後皮膚越來越好了！如果說能夠擁有一副白到發光的皮膚的話，那一定是很多小仙女的願望了。相信很多小姐妹們在美白這條路上使用過很多的產品，很多人都熱衷於一些歐美的大牌產品，其實呢這些年國貨也在慢慢的崛起。
手機導航與車載導航哪個更好用?

隨著技術的發展與應用，車載導航不再是高端車型獨有的配置了，很多中端車型，甚至低端車型也紛紛配備了車載導航，讓我們告別了「盲走」時代。車載導航市場方興未艾的時候，手機導航的出現，讓我們有了另一個選擇。手機的發展促進了手機導航的發展，目前手機導航的普及讓車載導航的處境十分尷尬，那麼造成這個局面的原因是什麼呢？
真正能用的車載系統什麼樣?深度體驗斑馬智行系統!

近幾年各大車企都在「智能互聯」上下功夫，最直觀的就是「用觸控、換大屏」，但與之同時，身邊許多人開著搭載大屏的車時依然在用手機導航、聽手機裡的歌，問其原因，「不好用」是聽的最多的一個回答，各種各樣的「不方便」和「太麻煩」影響了他們的使用體驗，那麼市場上的這些「大屏」到底是剛需還是噱頭？有沒有好用的呢？我們今後會陸續給大家一一測試，今天我們就先來測試一下名頭非常響的榮威斑馬智行系統。
積極融入集體,胡梅爾斯:桑謝斯的德語英語越來越好

今天，《圖片報》撰文揭示了桑謝斯狀態復甦背後的細節。在對陣本菲卡的比賽結束後，拜仁主管薩利哈米季奇對桑謝斯大加讚賞，他表示如果延續這樣的狀態，這位小將將成為拜仁不可或缺的一員，並有望成為世界頂尖球員。《圖片報》透露，桑謝斯初到拜仁還有很多不適應，現在他努力融入球隊中，積極學習德語，雖然德語對他來說仍然很有難度，但他已經能夠更深入地理解了。
祝祖國越來越好

7 時整，五星紅旗升上了旗杆頂端，人群中響起掌聲和歡呼聲，「祝祖國越來越好！祝成都越來越好！」　　四川大學錦城學院50多名大一、大二學生「組團」前來看升旗。升國旗儀式結束後，同學們在廣場上合影，高呼：「2019，我和我的祖國一起奔跑。」　　唐子晴本報記者郝勇郝飛攝影報導
都說農村戶口越來越好,但農民還是進城買房或轉戶口,為啥?

農村越來越好，為何還去城市買房或者轉戶口？也可以這麼說，大家都說農村生活越來越好，農村生活令人嚮往，農村有大面積的四合院，為什麼農民努力奮鬥還是想在城市買套樓房？背後原因令人心酸！說白了，都是不得已而為之！
反思力：學習越來越好的關鍵

特別是失敗、挫折的時候，如果將時間用在自怨自艾，而不去反省自己，那麼錯誤就是一個負擔。相反，如果能沉下心去挖掘失敗的原因，避免下一次再犯同樣的錯誤。那麼這樣的失敗，再來幾次都不怕。所謂屢戰屢敗，屢敗屢戰，重整旗鼓之後，能發揮出更強大的實力。我從小學開始，就有不犯同樣錯誤的習慣。隨著年齡漸長，我發現這是個拉開差距的重要因素。

車載語音越來越好用了,原來背後有這些原因

相關焦點

想要改裝車載安卓屏幕?這些應該先搞懂!

曾國藩每遇小人時,就用鬼谷子這3句話警戒自己,變得越來越好!

影響你人際關係越來越好的3個原因，別再滿不在乎了

人緣越來越好的姑娘,通常都有三種「軟實力」,你學會了嗎?

網友:娘家越來越好,哥哥的生意也越來越好

百度輸入法洞察用戶需求,升級四大功能,真的是越來越好用了

大眾有家電互聯,自主可「思考」,原來車載系統已這麼先進

一個家有這四個徵兆,往往會越來越好

有了它 車載音箱秒變藍牙車載音響

能夠越來越好,也會越好越來.

女人為什麼變得越來越好強,主要有這三個原因

那些活得越來越好的女人,大多數都有這些特徵,希望其中有你!

無需專業拆裝,輕鬆實現車載藍牙音響智能語音操控

屈臣氏有款「平價」精華,良心又好用!用後皮膚越來越好了!

手機導航與車載導航哪個更好用?

真正能用的車載系統什麼樣?深度體驗斑馬智行系統!

積極融入集體,胡梅爾斯:桑謝斯的德語英語越來越好

祝祖國越來越好

都說農村戶口越來越好,但農民還是進城買房或轉戶口,為啥?

反思力：學習越來越好的關鍵

有了它車載音箱秒變藍牙車載音響