12月1日-2日,由蓋世汽車主辦的「2020第二屆車聯網與智能座艙大會」隆重召開。本次會議主要圍繞車聯網、座艙域控制器、車載作業系統OS、OTA、座艙顯示等車聯網及智能座艙領域熱門話題展開探討,共謀產業未來發展之路。下面是百度車聯網事業部AR方向資深專家鄧蘇南在本次大會上的演講。
百度車聯網事業部AR方向資深專家 鄧蘇南
非常感謝張總的介紹。今天我想跟大家分享一下自動駕駛時代HUD的技術展望,包括HUD的價值是什麼?百度能提供的價值是什麼?這個行業趨勢是什麼?百度的優勢和規劃又是什麼?
先來看一下行業趨勢,其實前面張總已經介紹了HUD的硬體,我稍微講一講C-HUD、W-HUD和AR-HUD這幾者大概的差別。我們的想法跟大家是一致的,C-HUD肯定是一個階段性的東西,,屏也小、展現的信息也少。W-HUD能展示的東西多一點,是目前的主流產品,但依然是一個過渡產品,未來AR-HUD將是最終的發展方向。
但這三款HUD為什麼會存在?它們給用戶帶來了怎麼樣的價值?這個是需要我們去深度剖析的,W-HUD成像的範圍很小,距離也只有4到5米之間,但是寶馬的W-HUD布局了5年,從2013年開始布局到2018年業內首發,一開始他們以為只有1%的選配率,但事實上高達40%到50%,而且用戶用過的都說好,好評率達到了99%。這個可能跟大家的印象不一樣,之前大家覺得一定要全屏,才能實現用戶的終極價值。
但是為什麼W-HUD看起來很小,能呈現的信息也很少,卻也能給用戶提供價值?這給我們的啟發是什麼?我們分析了下,發現W-HUD雖然小,但是它解決了用戶要低頭看手機或者屏幕的問題,將用戶的注意力集中在駕駛上,它能為用戶提供最基礎,也最核心的導航信息。這個啟示告訴我們,W-HUD已經能夠給客戶創造價值。
W-HUD的量產情況我們也做了一些調研。讓我們來看看它的趨勢是什麼?車型正從高端向低端下放,寶馬原來是7系才搭載,現在下放到5系、3系。2018到2019年之間,我們又看到另外一些豪華車品牌開始上W-HUD,從2019到2020年,國內的一些品牌也開始上W-HUD。所以在未來幾年W-HUD還會是主流,並進入全面開花的階段,它的趨勢是從高配向低配,從選配走向標配。現在很多人提到AR-HUD,就覺得應該是全屏或者至少30度到40度,但是如果從W-HUD來看的話,其實10*4度的FOV是夠的。我們要思考的是在現有的FOV和成像距離參數下,能夠給用戶提供怎麼樣的信息和價值?
AR-HUD的用戶價值又在於什麼呢?我覺得HUD取代儀表屏是必然的趨勢。剛才黃總講得非常好,車內的屏很多就好嗎?功能很多就好嗎?是不是功能和亮點越多越好?那什麼叫做好?在這裡講一下我們這邊的理解,我覺得精準才是好,什麼叫精準?當你需要的時候把信息推送給你,並且只推送給你想要的信息。我們在車內如果放很多個屏,用的次數和頻率又是怎麼樣的,你夠不夠得著、用得到?精準的話,就是為用戶及時的提供有用的信息,高效簡潔,又不對用戶造成幹擾。
AR-HUD和W-HUD的差別在哪裡?這裡有寫到兩點,因為FOV會大、呈現的信息會大,所以這個信息量大,精準提醒是它一個很大的特點。第二點就是有強交互性。上面一張講的是你能獲取到什麼,是講的信息的概念。昨天聽到一位嘉賓說智能駕艙的核心價值是信息和服務,但實際上這兩個歸根到底還是信息,只是你拿到這個信息需要做什麼決策,是你做決策還是汽車做決策,這是一個階段的問題。如果是你做決策,那可能是L2級別或者是L2+級別的,如果是車做決策,可能是L4級別的自動駕駛。所以我們講的是這兩點,一個是信息,一個是交互。
我們也講到了智能,什麼叫智能?智能最初的概念是像人一樣有感官、有思考,智能的體現就是交互。如果人主動獲得信息,那很容易理解是不智能的;但如果我們可以通過一些交互,比如說你看一眼或者是你說一句話,汽車就能明白你,減少你的動作,這個就是指智能交互的概念。
AR-HUD的量產情況大家也比較熟知了,就是奔馳的S級,另外就是大眾、一汽、廣汽和奇瑞,它的趨勢是各大車廠都已經在布局,而且是從POC走向量產,布局的時間一般是3到5年,包括奔馳這一款也布局了蠻久,而且是硬軟體一起規劃。就像剛剛黃總說的,車身在設計階段就要做一些改造,所以也想跟線上線下的各位車廠大大們說,如果你們有HUD的規劃,那現在就要開始了,而且現在就要開始去定點選型,因為這個東西越早進入越有發揮空間。
我們對奔馳的案例做一個分析,因為百度對這個方面還是非常關注的,據我們所知奔馳是大陸提供的軟硬體,它的硬體方案是DLP,體積很大,達到了27L。所以奔馳量產最大的意義是讓車廠不再糾結於體積,體積可能不是個問題,我們先把它實現,能夠引領一個時代的發展,這個是比較大的意義。那是不是已經到來呢?未來1到2年,隨著量產的出現,它會慢慢鋪開。
這是我們對奔馳發布的視頻做的一個功能性的解析,裡面有ADAS功能、信息提示功能以及方向指引等等。同時我們把奔馳發布的這一款視頻的軟體跟百度的功能做了對比,可以說奔馳有的我們都有,奔馳有它的優點,但是百度也有自己的優勢。
接下來看一下行業布局,軟硬體的布局趨勢是怎麼樣的?在這個方面的探索,我相信百度是走在前面的,我們只想做最前沿的事情。在硬體上我粗淺按照投影方案分為傳統方案和第二代的全息光波導方案,傳統的方案優點是技術成熟、容易實現,但缺點也很大。全息光波導方案的優點是體積小,是未來發展趨勢,但是技術不怎麼成熟。如果我們現在談量產,或者說未來3到5年車廠能不能上HUD,我相信幾何方案是比較好的選擇。
對於這兩代HUD的分析,我們認為第一代HUD的成像是可控的,而且原理簡單,發展相對成熟,應該是未來3到5年主流產品的方式,而且奔馳的量產體積很大,其實我們車上也可以不必糾結體積的問題。第二代光波導方式還有全息薄膜方式,發展不成熟,量產還有一定的距離,但各大企業積極布局,像大陸公司收購了歐洲的一家光波導的企業,阿里也有投資瑞士的WAYRAY。
再來看一下軟體的趨勢, HUD的核心價值是什麼呢?第一點就是生態智能化,首先是信息的展現,昨天也有嘉賓把手機類比車機,這個也同樣的。HUD可以類比一下智慧型手機發展,智慧型手機最開始只有打電話、收發簡訊的功能,但是現在很少用打電話和發信息功能,我們用的是手機的生態,包括娛樂,聽歌、看視頻或者打遊戲,這個是智能生態。HUD未來一定是以AR導航為基礎功能的一個生態化的載體,在這個載體之上,你可以擁有藍牙電話、音樂,還有一些小程序,可以進行多樣化的信息推送,包括剛才講的精準信息提醒,還有高效簡潔的HMI設計等等。
第二點就是交互智能化,獲取這些信息是自己手動點按獲得,還是它自然而然地給你推送,這有一個智能化的過程。剛才也有嘉賓講到智能化的核心,5個感官最重要的是聽覺和視覺,我們對此也很認同,所以我們覺得語音操控和視覺操控是未來智能化交互的兩個重要發展方向。
跟大家分享一個小案例,在另外一些場合我講這個東西的時候有嘉賓提問說,你們怎麼看L4自動駕駛階段HUD的價值?那我們就要想一個核心的問題,在L4階段駕駛員真正的需求是什麼?就像我們坐公交車一樣,可能不需要親自開車,但希望對信息有所掌控,希望知道如果前面有一輛車過來有危險,車自動踩剎了,你要告訴我為什麼;下一個路口到哪一個路口了,該左轉還是該右轉,你要告訴我是不是要轉了,離目的地還有多遠。所以即使是在L4自動駕駛階段,駕駛員一定會有的需求就是對信息的掌控。需要了解,可能不需要實時關注,但是我一抬頭需要知道我到了這個地方,也需要知道其它的一些生態信息,比如天氣,終點信息等等。
還有HUD大家應該都知道,它只有在主駕位置看,這樣可以投射一些駕駛員覺得隱私性比較強的信息,有些客戶會問微信信息能不能投在上面?理論上是OK的,因為副駕和後駕位置都看不到HUD投射的信息。
所以AR-HUD的軟體比拼的是什麼呢?是AI能力和導航能力。導航能力必不可少是因為它是一個基礎功能,你不可能一個手機沒有打電話的功能。 AI能力就是我們所說的生態智能化以及交互智能化的智能體現。
再看一看百度AR-HUD現狀和優勢。其實我們AR-HUD發展的很早,我們在2018年就進行了業界首發,然後又進行了好幾輪的迭代,我們在上面進行了硬體升級,加了一個VPU,就是一塊專門處理圖片的晶片,利用這塊晶片我們可以加入ADAS功能。在這個基礎上,我們又做了多輪能力迭代,目前已經交付了一個POC,以及一個POC轉量產,還有多個量產項目在談。有朋友問我百度到底有沒有落地的產品?你們跟多少家車廠有合作?我們現在已經跟數十家品牌進行了深入的合作。
再講一下百度AR-HUD的優勢,可以分為4個點:第一點就是AR導航能力,我們知道AR-HUD最基礎的其實是AR導航能力。我可以跟大家普及一下這幾個地圖之間的關係,基礎地圖決定了你AR導航能做功能的上限,而AR導航你能做到什麼程度又決定了你AR-HUD的上限。AR導航我們迭代比較多,2018到2019年就有3個落地的量產項目,2019年也有3個落地量產項目。
第二點就是我們對AR-HUD這個特殊產品形態進行了技術突破。AR-HUD特殊產品形態是什麼意思呢?有人說你能不能把AR導航直接投射到AR-HUD上?不能,因為同樣的顏色,投射在室內的屏幕上跟投射在擋風玻璃上,視覺效果完全不一樣。在液晶屏幕上AR導航可以做半透明的效果,但是在AR-HUD上最好不要;在AR導航上可以做一些面狀信息還有一些很炫酷的效果,但在HUD上不行,因為要保證簡潔不遮擋視線。現在業內的一個共識就是, HUD顯示的信息不能過於複雜,否則遮擋視線會給用戶起到副作用。所以我們的產品都要在實車上實地跑一跑、測一測,因為你不知道你設計的東西投射到前擋風玻璃上是怎樣的狀態。
第三個就是跟車廠的實戰項目裡面去打磨我們的產品形態和用戶體驗。我們做的很多需求是來自項目的需求,而不是天馬行空的,因為我們發現越來越多的車廠跟我們有共同的認知,就是要抓住用戶的核心體驗,AR是增強現實,在轉彎的時候要不要把轉彎的箭頭貼的跟那個彎一模一樣?這個重不重要?其實沒有那麼重要,因為用戶要的是你告訴我該轉彎的時候轉,實時性、精準度比你轉彎指示的樣式更重要。所以我們其實是有優先級的,這個評判標準就是看用戶的核心需求到底是什麼,是打中他的要點還是錦上添花。另外我們深圳是有實車的,我們自己改裝了一輛車,上面硬軟體都有,我們會根據這個實車進行一些迭代,在真實場景裡面去做迭代,這個也比較有利於產品的開發。
第四點就是功能迭代或者產品迭代都離不開智能,但智能是需要技術沉澱的,百度在AI方面的技術沉澱有目共睹。另外我們有一個智能駕駛體驗中心,這個體驗中心提供了一些用戶調研,也給我們的產品設計提供了一些策略和建議,後面也會介紹這個部分。
先看一下AR導航產品,剛才講了AR導航是AR HUD這個產品形態的靈魂,是後續邁向L4階段的一個重要技術積累。第二是融合定位,百度做HUD軟體的優勢在哪裡?其實是在融合定位這一塊,因為我們可以把所有的晶片融合起來,1+1大於2。融合定位裡面有慣導,有圖像,慣導可以讓導航在隧道和高架都得到精準的提醒。也有朋友說HUD想讓用戶體驗特別好,在高峰期前面道路看不到的時候,怎麼知道該不該左轉或者變道?這個聽起來簡單,但實際上涉及的點還是蠻多的。首先是給你什麼樣的信息提示,用什麼樣的標誌告訴你,是用三角形還是箭頭,這是HMI層面。第二是策略層面,在轉彎多久之前告訴你提示或者告訴你變道,高速場景跟普通道路是不是一樣的時間。第三是算法層面,要精準判斷你在第幾車道,然後給出你精準的定位,才能給出這些提示信息,但精準的提醒和精準的定位要麼就上高精地圖,要麼就是把普通地圖利用融合定位做成跟高精地圖類似的效果。高精地圖大家都覺得好,但是它貴,落地是有一個發展階段的。我們現在想在普通地圖的基礎上,把這些硬體的晶片結合起來,給用戶一個更精準的提醒,這樣既節省了成本,又能夠補充高精地圖發展之前的gap。
第三個是多樣渲染,渲染就是在提供信息的時候渲染成一個3D、2D的效果,但渲染是最上面一層,重點在以怎麼樣的形式去顯示,前面還是要有感知和定位,才能把信息顯示的非常清晰。百度的優勢是這上述1、2、3都會做。
第二個就是我們的亮點功能,我們有AR-ADAS功能,包括車道線偏離、前車預警、行人預警、交通標識牌等等。大家也知道我們在一些城市已經落地了V2X的示範項目,V2X也是可以加到HUD上的。HUD未來是起到顯示屏的作用,但是信息是最關鍵的一個環節,所以百度在這個方面的積澱都會成為HUD上面顯示的一個生態環。
然後是車道級的指引,我們目前是不需要用高精地圖的,我們用普通地圖再加上多傳感器融合,能夠起到車道級的定位,並給出相應的指引。第三個就是一個常規的功能。
百度AI能力的介紹分為這幾個方面:晶片、算法、大數據建設、內容生態。剛才講了智能駕艙,智能的靈魂在於「智能」二字,這個肯定離不開AI能力。AI分為語音、視覺、導航定位,這三個是靈魂中的靈魂。導航定位是基礎功能,語音和視覺是兩個重要的交互形態,如果交互不智能,這個體驗就沒有辦法智能。
在語音上面,我們可以達到聲紋識別、車載音節識別,視覺上面我們有量化的模型和專項車載場景訓練模型。關於語音和視覺,我想Highlight的是我們進行了場景化訓練。語音跟小度音箱交互,這是居家場景,但是移到車上,可能這個專項場景是很多友商沒有做到的。這個是針對場景裡面具體問題具體突破,比如你面臨的場景是狹小空間,四五個人坐在車裡,後排交談,你跟車機互動會受到幹擾,這個時候您要怎麼解決?
再比如說視覺,你在室內人臉識別比較好做,因為光線很正常,你坐在那兒是靜止的。但是在車載環境裡面, ADAS攝像頭對外,要探測的物體是移動的。移動物體、高速場景,陰雨天、黑夜怎麼解決,這些都要進行專項場景訓練。所以我們車聯網的定位是把這些高精尖的技術場景化,我們做的東西是專門為車載場景而生的產品形態。
導航定位方面,我們有領先的車道級、亞米級的高精度定位,這個緩解了客戶對高精的需求壓力。還有我們語義SLAM的發展,目前也是為我們後期做一些新功能提供了技術積澱。
再者就是我們AI大數據的建設,在語音方面我們知道要訓練一個比較好的語音效果,需要有資料庫,我們的語音裡面有六百萬條語音數據模型,導航覆蓋方面,我們是1000萬公裡道路裡程覆蓋,1.5億全球POI,數據量行業領先。在ADAS數據方面,我們有中國最大的數據採集車隊,AI賦能生產線高度自動化,還有中國首個全要素高精審圖號公司。
在AI生態上,也是從這三個方面去講,語音、視覺和地圖。語音有邊聽邊說全雙工,用戶可以一邊聽音樂、有聲書,然後免喚醒。我們也支持一些方言,所以語音和視覺上面我們可以看到,我們介紹的重點是場景化,比如說視覺我們也是支持車內車外十多種任務識別,覆蓋人臉、手勢、車輛、行人等等。地圖也是行業唯一基於AI和大數據獨創的實時路況預測等功能,準確度和路況實時精準性是業內第一。剛才講的那個精準提醒,其實是有一個問題的,比如說我們開車最怕什麼?最怕走錯路口,所以這個提醒的及時性和精準性就很重要,這個也是導航的一個重點。
再講一下百度智能駕駛體驗中心,這個跟我們今天的主題會更加契合一些,這個體驗中心的常規功能包括產品體驗、策略諮詢、用戶行為研究分析,還有一些前瞻性的交互性創新設計,包括空間造型的工業設計,商業品牌重塑等等,它們專注在交互等方面,並且基於此跟國內高校合作產生了一系列的學術論文,其中一個成果相信大家會比較感興趣,就是基於無人駕駛體感的模型評估。有嘉賓講到我們要在智能駕駛裡面講究體驗的舒適性以及體驗的感覺比較好,但是這個感覺有哪些指標來衡量呢?我們把智能駕駛體驗中心拆解出來,分了三層。包括整體維度上的舒適度,從這個舒適度可以進一步拆分,看具體來自哪些方面,可以來自體感、安全感、智能感。第二層,這三個感知方面我們又拆分成更細節的這些點,這些研究成果也有發表在一些高質量的論文上面。
最後再講一下AR-HUD方面百度的一些規劃。在產品上的規劃我們還是集中在HUD的核心價值上,核心的產品能力除了剛才說的智能生態和交互,目前3到5年我們所要聚焦的中心還有它的指引性、安全性,也就是ADAS相關功能和沉浸性。我們剛才講HUD分為2D、3D,那是2D好還是3D好,怎麼樣讓駕駛員科技感最明顯,所以我們的產品目標集中在指引性、安全性和娛樂性方面。
在這個基礎上,我們也進行了相應的技術規劃,包括雲端技術、車道定位和精準化的綁路,所有這些都是為了之後能夠實現更精準、更好的用戶體驗做準備。我的演講就先到這裡,非常感謝大家!