滴滴做自動駕駛非常明確。
8 月8 日,CCF-GAIR 2020智能駕駛專場上,滴滴自動駕駛公司COO孟醒提到,滴滴做的是針對L4級自動駕駛的RoboTaxi。L4延伸出來是L5,這是其未來的方向。
滴滴的核心基因是出行公司,出行是滴滴的基因。出行的重點是安全,當滴滴考慮做自動駕駛時,主要圍繞的就是安全。
以下是孟醒的演講全文,雷鋒網新智駕進行了不改變原意的編輯:
各位下午好,很高興來到CCF-GAIR 2020現場跟大家分享滴滴自動駕駛在過去一段時間所取得的進展,以及我們對未來的展望。
在開始分享之前,我先明確一個觀點:自動駕駛是一件很難、很大的事情。很多公司都從技術方向努力,但從實踐來講,自動駕駛除了需要戰略、方向、意願,還需要基因。某種程度上你會帶著天生的基因以及思考的維度,使得你做自動駕駛的角度與別人不同。
滴滴的核心基因是我出行公司,出行是我們的基因。
出行的重點是安全,當我們考慮做自動駕駛時,我們的初心就是圍繞安全開始的。
有數據表明,全球每年因交通事故死亡的人數很多,約100多萬人。其中,道路交通事故是5-14歲兒童和15-29歲年輕人的首位死因,這不光影響未來年輕人,還影響很多祖國未來花朵的成長。滴滴自動駕駛的初心就是改變這種現象的發生,哪怕只起到一點點改變也是我們非常希望做的事。
從全球的交通數據來看,每年因全球航空事故的死亡人數是562,航空運輸量比交通運輸量小很多,我們有沒有可能把135萬變成562,當然,我們希望這個數字是0。這是我們做這件事的初心,不是技術,不是體驗,而是安全。
保證滴滴自動駕駛安全的三點是ADN:核心是AI能力,燃料是數據,邊界是出行生態網絡。
分別介紹這三個方向滴滴的工作。
1、人工智慧駕駛
第一,核心的人工智慧技術。滴滴自動駕駛非常明確,是針對L4級別的RoboTaxi。當然,L4延伸出來是L5,這是未來。有人認為未來會實現,有人認為不會實現,有人認為某個時間點會實現。此外,L4級自動駕駛以上的能力是我們現在的方向。
值得注意的是,其全棧能力都是自主研發,從車上的感知、預測、規劃、控制,到車下的仿真、功能安全、信息安全、基礎架構、系統集成等一系列都是我們自己做。而且這件事我們做了4年。
當然,上圖是一個框架,框架定了,並不代表你能做得好。因為在框架的背後有兩件比較重要的事情。
我相信今天所有人看到的L4級自動駕駛車,其能力還未達到車在沒有安全員的情況下,完全放出去跑1-5年,這件事今天大家都達不到。不過,這是大家目前努力的目標。
與此同時,能達到上述目標的核心是迭代的速度如何更快。當然,更快的背後有兩件事:
一是—見多識廣,就是更多的長尾場景。80%的場景我們今天都能解決,難的是最後的20%、2%、0.2%這些場景,只有見過這些場景才能訓練、迭代最終解決。
二是—千錘百鍊,就是在這些場景下要跑更多的裡程、做更多的測試。
其中,長尾場景是很難解決的一件事,原因是今天大家的車很少。目前自動駕駛的測試數據絕大多數來自於自動駕駛測試車,但自動駕駛測試車尤其是L4的測試車還不是量產的車型,絕大多數測試車是把軟體、硬體、計算平臺裝在車上測試。多數都是有幾十輛或者幾百輛,沒有一家公司有幾千輛L4級自動駕駛測試車。
就算擁有幾百輛測試車,每年能跑的裡程也是非常有限的。對應長尾場景,今天累計裡程能跑到幾十萬、幾百萬,多的甚至上千萬的裡程。
但是,有很多場景上千萬公裡才出現一次,有些裡程上億公裡才會出現一次。而且你要解決這樣的場景,你要見過同樣場景100次、1000次,甚至10000次,才有足夠多的數據解決該場景。
如此,怎麼辦?
對滴滴而言,我們不光有自動駕駛測試車收集這樣的場景,我們還有桔視。
桔視是我們為司機師傅提供的安全保護設備,主要提供車前行車記錄、行程中車內錄像、判責及申訴取證等功能,50%的滴滴訂單都有桔視設備的保護,一年下來大概有1000億公裡的數據。
值得注意的是,桔視涵蓋的場景非常廣,包括城市、鄉村、城鄉結合部等,此外晚上也有「奇奇怪怪」的場景,包括雞飛狗跳,老年代步車逆行。
值得注意的是,長尾場景不光體現在數據複雜度上,還包括交通參與者動作的複雜性。
例如,我們在上海測試到的場景,有一個大車擋住對面來的大車,而且是跨線過來的。你不知道他會變得更違規過來還是回到自己的線上,這個過程中,預測的難度是很高的。
這樣的預測跑多了以後,我們才知道對應的車該如何對應處理,同時比較好地跟別人進行交互。同時,保證我們對這樣的車如何做得預測更準確。
除了我們的自動駕駛車輛外,我們還有桔視,它大概有5-6個數量級以上的額外數據讓我們看到更多的場景,然後提取出來變成我們可預見的長尾場景,最後在仿真場景裡測試,以此不斷提升我們的算法。
幾十輛、幾百輛的自動駕駛測試車是非常有限的,因此我們擴展測試裡程就是增加仿真,仿真可以提升10-100倍左右。
仿真產生出來的新場景,往往其分布跟真實世界場景的分布不盡一致,很多時候是我們創造出來的,雖然它對我們的算法提供新的挑戰,但它對我們解決現實中的問題有一定的偏離。
桔視好處是我們有上千億級公裡數據的自動駕駛輔助,1000億公裡不是每公裡都有用,但它能幾乎覆蓋所有的長尾場景,而且遠遠不止複製一遍。
2、數據
滴滴自動駕駛燃料數據分為兩種:一部分是與技術迭代相關的數據,另一部分是與運營相關的數據。
滴滴作為網約車平臺,因為其原生形態會自動產生很多數據,包括路程行徑軌跡、用戶需求、未來預測、軌跡數據、用戶行為等。
L4級自動駕駛車與網約車不同,網約車可以從一個城市開往另一個城市,L4級自動駕駛車是從一個區域開始,會受到地理、天氣情況,以及交通參與者的限制。
這些限制我們會逐步打開,可能以線上OTA方式打開,也可能是大版本迭代打開。不管怎樣開放這個過程,它都是一步步展開的,不會以城市為單位逐步打開。
反過來想,我們如何在起始範圍或者小範圍內達到服務客戶的目的?
舉例來看,如果開放區域太小,像機場等場景,可能訂單是很多的。如果不在你自動駕駛的區域範圍內那就無法服務乘客,如此體驗很差,乘客不會用你的服務。
怎麼做?
滴滴平臺每天會產生大量的運營數據,8年的累計不僅有數據還有經驗。
其一是經營地圖。我們把所有數據放在地圖看,哪些路的收益最大,哪些地段有訂單,哪些地段沒有訂單。
最重要的是,我們可以確定有沒有閉環,以及會有多少訂單。
其二是安全地圖。我們會考慮哪些路段上人類司機開車發生重大事故、刮蹭事故、小事故,同時我們會對每個路段進行打分,然後用可視化的方式進行標註。
其三是技術地圖。根據現在技術定義和路段本身的限速、車道清晰程度、自行車道和汽車道等打分。
可以看出,上述圖片裡的三張地圖代表的含量信息不一樣,但都是結果化信息。
更重要的是,我們把三張圖放在一起形成滴滴戰術地圖,以此循序漸進推進自動駕駛。
這是一個很有意思的例子,我們把它做出來並形成了一套打法或者產品化的思路。雖然它具備時效性,但我們會基於大數據平臺會實時更新,最終這些數據可能以秒為單位迭代。
其實,這套方法論非常普適,在中國普適,在全國不同地方都非常普適。
傳統來講,如果我們需要在小範圍內開一片區域運營。首先,我們需要調研用戶出行習慣,看有沒有用戶在哪裡打車,需求是什麼。同時,驗證技術的可行性,這可能又需要一段時間,判斷會不會遇到現在技術不能解決的問題。然後,我們在這個區域裡用自動駕駛採圖、打磨、迭代。整個流程大概需要半年時間。
現在來講,我們只需要把三圖合一形成戰術地圖,從需求角度、技術角度、安全角度搭建這套體系大概10秒鐘時間,最終量化判斷結果。
本質來看,我們在做自動駕駛本身的產品定義。
大家都在討論L4、L5級自動駕駛,但它們依然是宏大的概念,也有各自其定義。重要的是如何限定各自範圍、區域,並進行迭代和擴張。
其實,任何一家創業公司都面臨這樣的選擇。這個命題不難,但執行起來很難,因為你沒有數據。
這個過程在移動網際網路時代是依靠產品經理實現,但在自動駕駛場景裡主要是量化和數據實現。
3、網絡
運營網絡是我們自動駕駛行駛的邊界。
在滴滴平臺上有很多產品,包括計程車、快車、豪華車等,絕大多數經常打車的同學非常熟悉。
自動駕駛車是我們額外的品類,這件事有什麼意義?
當你只有自動駕駛車輛,沒有其他品類車輛的時候,幾十輛車、幾百輛自動駕駛車在限定的區域裡是無法很好地服務用戶的。
對用戶而言,早期就是嘗鮮,但只有限定範圍和少量車,就無法提供很好的體驗。
滴滴是採取混合派單的方式解決上述問題。
在滴滴平臺上,我們把自動駕駛車和大量有司機駕駛的網約車放在一起,當區域、路況、天氣符合自動駕駛條件時,我們把單派給自動駕駛車輛,否則就派給網約車司機。
其實,司機在相當長一段時間是非常重要的元素,他們是我們運輸的主力,同事也解決了自動駕駛長時間無法解決的問題。
實際上,自動駕駛車輛和有司機駕駛的網約車是相輔相成的。他們可以在兩種情況下無縫連接,逐步快速迭代自動駕駛網絡的生成。
因為自動駕駛車隊不可能一步到位完成所有事情。
除了運營網絡外,還有兩個網絡很重要:乘客和車隊運營。
乘客運營網絡方面,滴滴有超過5億用戶,一年有超過100億次的運送人次。我們有非常多服務經驗,這個經驗是無價的。你服務第一個客戶時有很新鮮的體驗感,當你服務100個用戶時,他們提出的意見、需求各不相同,這時候你對產品的需求不斷變高。當你服務到10萬、100萬、1000萬時,你的認知是不斷迭代的。其實,滴滴網約車的形成也是是經過每年百億次的打磨做成的。
車隊運營網絡方面,對應的客戶是龐大體系的車隊。這些車絕大多數不是滴滴自己持有的,但很多車是我們服務的,包括集中採買、車輛使用、車輛養護、充電、加油、維修、後續處置等,滴滴有相當長時間的經驗,服務超過100萬輛車的車隊。
在自動駕駛時代,上述提到的都是我們L4級自動駕駛技術以外的能力。當RoboTaxi真正落地商業化時,
這些能力變得尤為重要。
上述提到的運營能力體現在哪些上面?與我們一般認知有什麼區別?
在運營場景下,滴滴自動駕駛涉及安全的場景是這麼做的:
提到自動駕駛安全,一般人們會想到車上是否有安全員、安全員身份是否核查,以及車輛、車輛狀態、行程等是否都有檢測。
除此之外,實際上我們會做整套體系,這是一個龐大的體系,還包括車輛檢查、接單限制、安全員、功能確認、測試等,這是安全體系裡都會涉及的部分,大概76個模塊。
76個流程就是為了做好滴滴自動駕駛安全這件事。不過,這只是是幾十輛、幾百輛自動駕駛車輛的安全管理體系。還不包括未來運營更多車輛、硬體設施、軟體開發的安全流程。
這只是一個例子,背後其實還有很多這樣的例子在運營體系裡。
做好技術是一方面,做好技術所帶來的應用場景是另一方面,這裡面有很多細節,非常難的。
回顧剛剛分享的三點:AI能力、大數據和網絡,這三者結合是我們滴滴自動駕駛的DNA。
滴滴做網約車自動駕駛場景非常合適,因為滴滴自動駕駛有天然的基因優勢。上述三者結合,自動駕駛這件事我們可以看得到希望,並能把它做出來。
6月27日我們在上海把基因、能力、運營能力、經驗組合在一起,在上海嘉定區域啟動載人示範,普通乘客可以直接報名體驗滴滴自動駕駛車。包括比較複雜的真實場景,跟一個城市覆蓋絕大多數的室內場景相似,包括地鐵站、購物中心、會展中心、大公司辦公場景以及居住區域。上線當天有了萬人報名,現在超過數萬人報名。
除了車上的運營以外,我們真正運營還包括安全護航中心。
因為車上不能解決所有的場景,比如遇到交警指揮,你不知道自動駕駛車是否懂得交警的口語、手勢等。我們設置的安全護航中心類似火箭發射指揮中心的中控平臺,它會檢測車輛的運營情況和報警情況,如果發現問題,它會調取車輛的實際運營狀態,並且給予提示和參與意見,讓車更好地處理長尾場景中不能處理的場景。此外,安全護航中心還能看路上的情況。
更重要的是,滴滴擁有自己的車路協同團隊。
做自動駕駛時做車路協同,對車路協同本身的開發很重要。如果只做車路協同不做自動駕駛,往往車路協同的解決方案不是為使用方考慮的。如果你兩方都做,就算不是自己鋪基建,那也是從需求方的角度整體考慮這件事。
目前,滴滴有完整的解決方案,我們在上海鋪設了這樣的方案。從路的角度來看,可以看到我們的盲區、紅綠燈等車內看不到的場景,通過我們車路協同的設備就能直接進入車裡,進行感知協同。
最後,分享兩個小故事:
滴滴自動駕駛上線以來,00001號體驗乘客是在上海迪斯尼跳舞的舞者,她認為自動駕駛對她們是一種美好的體驗。
她給我們特別大的鼓勵,但比起鼓勵,我們更珍惜的是對我們的打擊和鞭策。
還有一位60多歲退休的大學教授,他坐過很多自動駕駛車。當天,他開了2個多小時的車過來體驗滴滴自動駕駛車,同時提了很多意見。正式這些意見讓我們走出舒適區,進入無人區,不斷擴大邊界。所以鼓勵和鞭策對我們來說都很重要,都是我們往前走的動力。
雷鋒網 雷鋒網(公眾號:雷鋒網)
雷鋒網原創文章,未經授權禁止轉載。詳情見轉載須知。