KDD 2018:滴滴提出WDR模型顯著提升ETA預測精度

2020-12-04 雷鋒網

活動

企業:滴滴

操作:獨家約稿

事項:KDD 2018獨家約稿

更多相關

國際數據挖掘領域的頂級會議 KDD 2018 在倫敦舉行,今年 KDD 吸引了全球範圍內共 1480 篇論文投遞,共收錄 293 篇,錄取率不足 20%。其中滴滴共有四篇論文入選 KDD 2018,涵蓋 ETA 預測 ( Estimated Time of Arrival, 預估到達時間) 、智能派單、大規模車流管理等多個研究領域。

四篇論文分別是(文末附論文打包下載地址)

Kaixiang Lin (Michigan State University); Renyu Zhao (AI Labs, Didi Chuxing); Zhe Xu (AI Labs, Didi Chuxing); Jiayu Zhou (Michigan State University)

Yaguang Li (University of Southern California); Kun Fu (DiDi AI Labs); Zheng Wang (DiDi AI Labs); Cyrus Shahabi (University of Southern California); Jieping Ye (DiDi AI Labs); Yan Liu (University of Southern California)

Zhe Xu (AI Labs, Didi Chuxing); Zhixin Li (AI Labs, Didi Chuxing); Qingwen Guan (AI Labs, Didi Chuxing); Dingshui Zhang (AI Labs, Didi Chuxing); Qiang Li (AI Labs, Didi Chuxing); Junxiao Nan (AI Labs, Didi Chuxing); Chunyang Liu (AI Labs, Didi Chuxing); Wei Bian (AI Labs, Didi Chuxing); Jieping Ye (AI Labs, Didi Chuxing)

Zheng Wang (Didi Chuxing); Kun Fu (Didi Chuxing); Jieping Ye (Didi Chuxing)

本文是對滴滴 KDD 2018 Poster 論文《Learning to Estimate the Travel Time》的詳細解讀,在這篇文章中,滴滴技術團隊設計了一種使用深度神經網絡來預測預估到達時間(ETA)的方案,通過將 ETA 建模成一個時空回歸問題,構建了一個豐富有效的特徵體系,進一步提出 Wide-deep-recurrent(WDR)模型,能在給定出發時間和路線的情況下更加準確地預測。這一事件在雷鋒網(公眾號:雷鋒網)學術頻道 AI 科技評論旗下資料庫項目「AI 影響因子」中有相應加分。

 從規則模型到完整的機器學習方案

ETA 是智能交通和位置信息服務(Location Based Service,LBS)中至關重要、又極具複雜性和挑戰性的問題。它不僅需要考慮交通系統的空間特性,比如途徑紅綠燈的個數、道路的限速、是否可以繞遠走快速路;還要考慮交通系統的時間特性,比如早晚高峰的規律性擁堵和交通事故導致的偶發性擁堵等。同時,因為交通系統的運行需要人和車作為主體來參與,也少不了外部因素的影響,因此時間預估問題還需要引入對個性化特徵和外部特徵的建模,比如司機駕駛習慣、雨天霧天對行車速度的幹擾等。

在滴滴平臺,ETA 是一項必不可少的基礎服務。無論是行程前的預估接駕時間、預估價格顯示,還是派單、調度、拼車等系統決策,亦或是行程中的預計到達終點的時間計算等,離不開高精度 ETA 的輔助。滴滴每天有約 700 億次的 ETA 請求,峰值時每秒要處理約 400 萬次。

用規則模型計算 ETA 是此前地圖行業通用做法之一。即分別計算各段路的行駛時間,全部加起來再根據紅綠燈時間做一個偏移修正。用數學來描述,預估時間可以表達為

其中,是第 i 個路段的預估行駛時間,而 是第 j 個紅綠燈的預估等待時間。下圖更為直觀地展示了這種計算方法:

這是完全根據物理結構構建起來的模型,而其中最關鍵的部分在於每一路段的時間和每一個紅綠燈時間的獲取。考慮到路段的通行狀態每時每刻都在動態變化,一個比較實際的做法是利用最新的歷史數據(比如,剛剛過去的 5 分鐘)來估計路段的實時通行時間,而把歷史平均通行時間作為默認值來填充信息缺失的路段(若一個路段在最近沒有滴滴車輛經過,此時它的通行狀態是未知的)。紅綠燈亦可採用類似的做法從數據中去挖掘每個紅綠燈的歷史平均等待時間,用作.

規則模型雖然在線服務計算量小,易於實現,但其使用大量基於經驗和直覺的人為規則,不僅缺乏科學的探索方法;局限多、擴展差,也容易遺漏了很多重要信息,比如個性化特徵等;此外,簡單的統計量也不足以分析出複雜的交通模式,核心指標往往容易面臨瓶頸,無法再靠添加新規則進行優化。

為了更好地發揮海量出行數據的潛力,滴滴於 2015 年首創了一整套機器學習系統來解決 ETA 問題。從類型上看,ETA 是一個很典型的回歸問題:給定輸入特徵,模型輸出一個實數值,代表了預測的行程時間。滴滴探索和構建了一套系統的地圖領域的特徵和表達集合,包括空間信息、時間信息、交通信息、個性化信息、擴展信息等幾個方面,能充分考慮連通起點和終點的全部路徑、涉及的路段、路口和紅綠燈,以及所經過區域的 POI、行程對應的時間屬性、實時路況、司機的駕車行為以及天氣、交通管制情況等。

考慮到用戶對誤差的敏感程度更多的和相對值有關,滴滴將 MAPE(mean absolute percentage error)選擇為目標函數,對應於 MAPE 的優化問題為:

其中,是真實到達時間(Actual Time of Arrival,ATA),而是預估時間,代表了回歸模型。為了防止 over-fitting,還可以加上正則項

而在回歸模型上,滴滴先後考慮過兩種在業界比較流行的模型,Tree Based model 和 Factorization Machine。其中,樹模型的最終輸出是多棵樹的集成結果,可以寫成:

是模型中樹的數量。每一棵樹都會根據輸入特徵進行判斷,決定輸入數據所屬的葉子節點,然後將葉子節點對應的分數作為單棵樹的輸出,也就是

代表了第 t 棵樹全部葉節點構成的分數向量,是一個映射函數(通過一系列條件判斷),決定了應該歸屬的葉子節點序號。對於模型,其複雜度是由樹的結構和規模來控制的,即使用如下正則項

直觀來看,第一項對葉子節點的數目進行了控制,而第二項通過 L2 範數來對葉子節點的輸出 score 進行控制。用樹模型做 ETA 任務的目標函數最終可以寫成

而 FM 模型的核心思路是將特徵交互的權重矩陣進行分解,表達為向量內積的形式,以此來減少參數數量。二階 FM 的計算為

其中 d 是特徵維度,通常在千萬級別甚至更高。而參數向量的維度 m 相對很小,通常在幾十的量級便能達到較好的預測精度。FM 同樣可以對 ETA 進行回歸建模,加上一些正則項,就得到了優化目標

其中表示 v 向量構成的矩陣的 Frobenius 範數。

Wide-Deep-Recurrent 模型進一步提升精度

雖然這一完整的機器學習解決方案,為滴滴帶來了顯著的 ETA 準確度提升,但由於大部分回歸模型比如 XGBoost,能夠接收的輸入向量必須是固定長度的,而一段行程對應的路段(以下稱為 link)數變動範圍很大,因此在實際使用時,捨去了 link 級的特徵,取而代之使用整體統計值。所以在細節信息層面,這一解決方案還有優化的空間。

為了最大化信息的無損,保留模型對 link 序列信息的建模能力,滴滴創新地將深度學習應用到 ETA 上。這一 ETA 模型的核心思路是 global model + recurrent model。其中 global model 的作用類似於上一代模型,針對行程的全局信息進行學習;而 recurrent model 則專注於對 link 序列等局部細節的學習。

在 global model 部分滴滴考慮了近年來在推薦系統領域受到關注的 Wide & Deep 模型,以保證所有模塊都可以進行端到端的訓練。其 Wide 分支其實和 FM 是源出一脈的,對特徵進行二階交叉,對歷史數據擁有一定的記憶功能。而它的 Deep 分支就是傳統的多層感知機結構,有較好的泛化能力。兩個分支強強聯手,能互取所長。

WD 模型的大體結構如下圖所示:

Recurrent model 的選擇則比較豐富,不僅僅限於 RNN(包括變種 GRU、LSTM、SRU 等),還可以是一維卷積 CNN,或者是純粹的 Attention model。以最流行的 LSTM 為例,它通過引入 additive memory 和 gate 來緩解簡單 RNN 的梯度消失問題:

將它和 WD 模型組合之後,就得到了 Wide-Deep-Recurrent model (WDR)。結構見下圖:

可以看到,這一模型總共有三類特徵:

  • Dense feature:行程級別的實數特徵,比如起終點球面距離、起終點 GPS 坐標等。

  • Sparse feature:行程級別的離散特徵,比如時間片編號、星期幾、天氣類型等。

  • Sequential feature:link 級別的特徵,實數特徵直接輸入模型,而離散特徵先做 embedding 再輸入模型。注意,這裡不再是每個行程一個特徵向量,而是行程中每條 link 都有一個特徵向量。比如,link 的長度、車道數、功能等級、實時通行速度等。

其中,Wide 和 Deep 模塊對行程的整體信息進行建模,而 Recurrent 模塊對行程的軌跡進行細緻的建模,可以捕捉到每條 link、每個路口的信息。在最終匯總時,Wide 模塊通過仿射變換把輸出變到合適維度,Deep 模塊直接把頂層 hidden state 作為輸出,而 Recurrent 模塊將 LSTM 的最後一個 hidden state 作為輸出。三個模塊的輸出向量被拼接起來,進入最終的 Regressor 進行預測,得到 ETA 值。全部參數都基於 MAPE loss 做梯度下降來訓練。

系統架構如下圖所示。最底層為數據源,分別是地圖信息、GPS 軌跡、訂單記錄和其它必要的附加信息。然後,原始數據經過特定的處理,變為模型可用的格式,用於訓練模型。注意這裡有一個小分支,表示在訓練完成之後還單獨取出了一小批 up-to-date 數據進行 finetune,使得模型更傾向於最新收集的數據。線下訓練好的模型,最後被推送到線上系統,對外服務。

線下實驗中,滴滴對 2017 年前五月北京滴滴平臺的數據進行了適當的過濾,發現無論是 pickup(司機去接乘客)還是 trip(司機送乘客前往目的地),其 WDR 模型有較大幅度的提升。

滴滴也進行了為期一周的線上評估,從曲線可以看到,其模型在線上實際系統中也有著領先的性能。

滴滴團隊指出,雖然其 WDR 模型能進行更準確的預測,但仍然有很多問題需要進一步地探索,比如怎樣引入路網的拓撲圖結構,如何與路徑規划進行融合,如何將路況算法與 ETA 聯合起來進行端到端的學習,如何預測時間區間而不是單個時間,如何提高線上系統的服務性能等,然是需要深入研究的課題。

(論文地址:Learning to Estimate the Travel Time

http://www.kdd.org/kdd2018/accepted-papers/view/learning-to-estimate-the-travel-time)

或點擊本連結移步AI研習社社區下載四篇論文。

雷鋒網原創文章,未經授權禁止轉載。詳情見轉載須知。

相關焦點

  • 論文詳解:滴滴大數據預測用戶目的地,準確率超90% | KDD 2017
    中滴滴研究院副院長葉傑平所帶的滴滴團隊關於計程車組合優化分單模型和目的地預測的論文《A Taxi Order Dispatch Model based On Combinatorial Optimization》被收錄。
  • 滴滴KDD 2019 論文詳解:基於深度價值網絡的多司機智能派單模型
    滴滴AI Labs技術團隊在KDD2018 Oral 論文《Large‑Scale Order Dispatch in On‑DemandRide‑Hailing Platforms: A Learning and Planning Approach》的基礎上,新提出了一種新的基於深度強化學習與半馬爾科夫決策過程的智能派單應用,在同時考慮時間與空間的長期優化目標的基礎上利用深度神經網絡進行更準確有效的價值估計
  • 李航等提出多粒度AMBERT模型,中文提升顯著
    近日,字節跳動 AI 實驗室李航等研究者提出了一種新型多粒度 BERT 模型,該模型在 CLUE 和 GLUE 任務上的性能超過了谷歌 BERT、Albert、XLNet 等。BERT 等預訓練語言模型在自然語言理解(Natural Language Understanding, NLU)的許多任務中均表現出了卓越的性能。
  • 上海交大團隊提出基於信號通路的肝癌風險預測模型
    該研究基於發現的13個與肝癌生存顯著相關的信號通路並構建了肝癌風險預測模型,在異質性(heterogeneity)較高的肝癌的多個數據集中取得了較高的預測精度,並且與新近發表的基於深度學習框架的預測模型進行了多方面的比較,表明了基於信號通路水平特徵的模型在預測腫瘤風險方面的優勢。博士生法博濤為論文第一作者,俞章盛教授為通訊作者。
  • 混合時空圖卷積網絡:更精準的時空預測模型|KDD2020
    以往的研究中主要利用通行時間這類交通狀態特徵作為模型輸入,很難預測整體的交通狀況,本文提出的混合時空圖卷積網絡,利用導航數據大大提升了時空預測的效果。日常通勤中的規律往往相對容易挖掘,但交通狀況還會受很多其他因素影響,之前的研究主要利用通行時間這類交通狀態作為特徵,少量研究引入事件,不能很好地預測實際交通流量。
  • ...2017鑽石贊助商,滴滴出行在現場有哪三大亮點值得關注?(附論文...
    在本文中,我們提出了一個新的調度系統來優化多個訂單下的計程車調度。這個系統旨在最大化全局調度的成功率,從而優化整體的交通效率,給用戶帶來更好的體驗。為了進一步提升用戶體驗,我們還提出了一種在開啟計程車預約APP時預測用戶目的地的方法。這種方法使用了貝葉斯結構來根據他/她的旅行歷史來對用戶的目的地的分布進行建模。
  • 地質地球所提出考慮結構面粗糙度影響的區域地震滑坡預測模型
    引入Newmark有限滑塊位移法來預測地震滑坡空間分布,是目前國際上應用最廣泛的地震滑坡空間預測模型。但Newmark模型未考慮巖體結構面的性狀對邊坡動力穩定性的控制作用,影響地震滑坡空間預測的精度,無法滿足地震防災減災的要求。
  • 滴滴新算法讓你兩不誤
    在滴滴、Uber、Lyft等共享出行平臺,時間預測的精度會直接關係到路徑選擇的合理性、訂單分配的精確性和交通系統的整體效率,從而影響乘客的出行體驗,以及司機的效率和收入;而且,海量的日均調用量也會對ETA模型的線上推理速度提出非常高的要求。ETA的複雜性和挑戰性,使其成為頗具學術研究價值的問題。
  • Google提出移動端新SOTA模型MixNets:用混合深度卷積核提升精度
    基於此觀察,作者提出了一種新的混合深度卷積(Mixed Depthwise Convolution, MDConv),它自然地在單個卷積中混合了多個內核大小。作為普通深度卷積的一種簡單替代,本文的MDConv提升了現有MobileNet在ImageNet圖像分類和COCO目標檢測方面的準確性和性能。
  • 深度學習預測RNA二級結構,螞蟻金服提出端到端模型E2Efold
    本文將介紹一種用於預測 RNA 二級結構的端到端深度學習模型 E2Efold,在結構預測方面具有顯著更優表現,同時大大縮短新冠病毒 RNA 二級結構預測時間,為病毒研究、藥物篩選、疫苗研製等工作提供更多助力。這項成果來自螞蟻金服的研究團隊,目前這篇論文已被 ICLR 2020 接收為 Talk 論文。
  • 中國軍團稱霸KDD:華人博士獲最佳論文,清華北大華為等榜上有名
    相較而言,KDD 2018年研究賽道接收181篇,接收率為18.4%,應用賽道接受112篇,接收率22.5%。因此,概括地說,戶外廣告印象數是這樣一個問題:廣告牌和預算就那麼多,路人們就那麼走,在這些給定的情況下,如何提升給路人們留下的總印象,讓錢花的最值呢?
  • 合肥研究院提出提升實驗室偏振定標精度方案
    自2018年「高分五號」成功發射以來,高光譜觀測02衛星(GF-5(02))、大氣環境監測衛星(DQ-1)、高精度溫室氣體綜合探測衛星(DQ-2)和陸地生態系統碳監測衛星(CM-1)等多個衛星均計劃搭載該衛星載荷。對DPC的輻射和偏振特性進行高精度的實驗室定標是保證其測量精度的關鍵。
  • 更精確地預估到達時間,滴滴新研究提出異質時空圖卷積網絡
    但如果我們打的是滴滴,這個問題就不用開口問了。因為,滴滴的研究者正不斷挑戰更加精確的到達時間預估結果,相關結果被 KDD 2020 接收為Oral論文。第 26 屆 ACM SIGKDD 知識發現和數據挖掘會議(KDD 2020)正以線上形式召開。
  • 基於單目圖像的深度估計算法,大幅度提升基於單目圖像深度估計的精度
    基於單目圖像的深度估計算法,大幅度提升基於單目圖像深度估計的精度 李倩 發表於 2018-06-04 15:46:49 基於視覺的自動駕駛系統需要基於單目攝像頭獲取的圖像
  • 大講堂 | 預測時間敏感的機器學習模型建模與優化
    原標題:大講堂 | 預測時間敏感的機器學習模型建模與優化 雷鋒網AI研習社訊:機器學習模型現在已經廣泛應用在越來越多的領域比如地震監測,闖入識別,高頻交易;同時也開始廣泛的應用在行動裝置中比如通過邊緣計算。這些真實世界的應用在原有的模型精度基礎之上帶來很多實際約束比如預測要在很短或規定時間內完成。
  • 加州拿證 鹽湖城獲獎 滴滴無人車布局加速
    一向低調的滴滴自動駕駛團隊,近期不斷有新的動作。繼五月在加州獲得自動駕駛路測許可,近期,滴滴AI Labs研究團隊又現身鹽湖城CVPR2018,攬獲自動駕駛領域世界級獎項。其中,域適應語義分割比賽要求參賽者利用遷移學習技術進行視頻圖像的語義分割,在帶有標註的源數據上訓練模型,並將其應用到目標域數據。該項任務的難點在於源域和目標域的地理位置、天氣狀況、時間等條件有顯著差異。如,利用採集自美國加州的路況數據訓練模型並成功應用於北京的路測數據是一項巨大的挑戰。
  • 自動化所提出基於腦功能影像時間序列的多尺度卷積循環神經網絡模型
    受此啟發,中國科學院自動化研究所腦網絡組研究中心隋婧研究組提出了多尺度卷積循環神經網絡算法(Multi-scale RNN),該算法能夠直接在時間序列(TC)上使用RNN模型自動學習fMRI的時間-空間特徵,突破了現有fMRI分析「先藉助時間序列構建功能連接矩陣再分類」的傳統框架。在此項研究中,採用了改進GRU模型作為序列處理的基本模型。
  • 預測模型的精度已經提高到可以和人腦完全互通的程度
    隨著網絡雲化和基於ai的數據資源分析、挖掘能力的不斷提升,計算結果的細節模糊性不斷降低,預測模型的精度已經提高到可以和人腦完全互通的程度,這使得機器可以比人類提前做出更有意義的預測。考慮到這一點,可以設計更加充分的預測模型,從而獲得更好的預測性能。
  • 拆解滴滴大腦 葉傑平談出行領域算法技術
    滴滴搭建的核心算法模型,可以幫助實現更準確的預測能力、智能的調配能力,提高效率降低成本,達到最優運力調度。雲計算提供強大、靈活的計算能力,滴滴的業務場景對計算要求和實時性都非常高,用戶輸入一個目的地,最佳合理調度都由滴滴大腦以毫秒級的速度來計算,例如通過滴滴雲計算搭建了大規模實時分單處理平臺,可以實現多維度最佳訂單匹配。滴滴平臺已經有數萬臺伺服器,未來兩年伺服器規模將達到數十萬臺。
  • 基於GWO-BP-CNN-ec的風電功率短期預測模型*
    通過仿真分析得出,基於GWO-BP-CNN-ec的組合模型預測效果優於單一CNN,GWO-CNN及GWO-BP-CNN,然後對比了基於BP、Elman、小波神經網絡的淺層網絡預測模型與基於CNN的深層網絡組合預測模型的預測效果,驗證出了深層CNN網絡在預測方面的精度優勢,在高風速段時尤為明顯。證明深層卷積神經網絡組合模型對風電短期功率預測精度的提升有顯著作用。