『引言:AI的浪潮勢不可擋,在無數大眾最熟悉的生活場景中,其實蘊含著許多未被發現的秘密。這些「深藏功與名」的AI技術,在最基礎的功能背後,卻演繹著數據和算法最動人的一面。百度地圖將通過揭秘黑科技一系列專題,講講地圖日常功能背後的技術。
本期內容將為你展示,百度地圖如何通過大數據的自學能力,進行堪比「福爾摩斯」的交通事故推演,找出引起擁堵的真正原因,並及時送上提醒和時間參考,避免用戶誤入一場由事故引起的「世紀大堵車」。』
你知道自己每年要浪費多少時間在堵車中嗎?答案恐怕是難以估量的。尤其是事故造成的擁堵,一旦發生交通事故,高速路也變成了「降速路」。不過,有的導航卻似乎有著「未卜先知」的能力,即使沒有用戶上報,也能夠準確推測事故並提醒擁堵時間。
「小度助手推測當前道路可能發生了事故,請來往車輛提前注意避讓。」「已擁堵超過2小時,超過1小時消散。」相信不少用過百度地圖的人都見過類似的提醒,當感嘆越來越精準的地圖軟體讓出行更順暢之時,你是不是也好奇過,它是怎麼知道前面有事故,而且這麼判斷的這麼快、這麼準就?這就要歸功於大數據的功勞。
百度地圖事故提醒
整體而言,百度地圖之所以能夠洞察交通事故,主要是通過大數據能力,學習用戶上報事件的特徵,結合當前路段的實時軌跡特徵,進行時空校驗,從而判斷事故信息。
首先,要在擁堵道路中選取前後一段時間都有用戶上報的路段作為正樣本,這意味著這段路確實發生了事故,再選取前後很大範圍都沒有用戶上報的路段作為負樣本。當然,這樣選取的負樣本數量會遠遠多於正樣本,需要按照通行流量對負樣本排序,選其中流量較大的前幾名,用以平衡正負樣本的數量。
其次,要提取道路的特徵。這既包含長度,限速、通行等級等自身屬性,也包含實時路況速度,路段歷史擁堵概率等路段特徵,同時還包含上下遊實時路況擁堵程度、歷史上下遊發生事故概率等連續性的空間特徵。
接下來,便是進行模型預測。按照道路等級等信息,可將樣本劃分為不同類別。分別訓練出不同類別的樣本和不同城市的模型。依次訪問不同的模型組合,尋找效果最優的「人工集成模型」。集成後的模型應用在不同城市時,分別使用不同的標準來劃分。至此,便完成了對事故的判斷。
最終,推斷出確有事故發生時,就到了進一步判斷事故發生位置的環節。這一環節可分為兩種情況:如果擁堵路段速度變化不大,則用訓練好的「回歸模型」預測事故位置;若擁堵路段速度變化較大,則擬合速度的二次曲線,輸入道路中多個坐標試驗,速度最小值偏下遊的地方就是事故的發生地。
擁堵路段速度變化較小時位置判斷
擁堵路段速度變化較大時位置判斷
判斷事故及其位置後,便是第一時間告知用戶。百度地圖的事故提醒在準確性的基礎上還包含了許多其他細節,事故位置、距離、通過時間、預計消散時間等一應俱全,用戶看起來更清晰直觀。
百度地圖事故提醒詳情頁
講完了事故推演,我們來說說擁堵路段的消散時間是如何計算的。
關於擁堵的消散時間,我們可以理解為未來一段時間的路況預測。目前百度地圖實現了分鐘級消散時間預測,舉個例子,如果我們預測未來5分鐘路況分別是擁堵,擁堵,擁堵,暢通,暢通,那麼對應的消散時間就是三分鐘。
目前百度地圖實時路況監測的準確率在99%以上,因此路況預測通常以實時路況作為樣本。對於要預測的路段,百度地圖將時間維度與歷史路況、實時路況、路段長度、通行能力等綜合影響因素納入DNN神經網絡,分別得出暢通,緩行,擁堵,嚴重擁堵4個級別路況。再以每分鐘內的通行情況是暢通還是擁堵,來推斷這段擁堵的消散時間。
流動的交通使路況變化萬千,要實現精準的交通服務,離不開大數據的支撐。不得不說,基於大數據資源進行深層次挖掘的百度地圖,給我們帶來了更有保障的出行和愈加便利的生活。而對於未來交通的預測,也有望成為交通大數據的又一個核心價值。