圖神經網絡讓預估到達準確率提升50%,谷歌地圖實現新突破

2020-12-13 機器之心Pro

機器之心報導

編輯:魔王、杜偉、小舟

公交車、計程車等交通工具的到達時間是影響公眾出行的一大因素。所以,預估到達時間(ETA)準確率成為非常實際的研究課題。近日,DeepMind 與谷歌地圖展開合作,利用圖神經網絡等 ML 技術,極大了提升了柏林、東京、雪梨等大城市的實時 ETA 準確率。

很多人使用谷歌地圖(Google Maps)獲取精確的交通預測和預估到達時間(Estimated Time of Arrival,ETA)。這是很重要的工具,尤其是當你將途經交通擁堵路段或者需要按時參加重要的會議。

此外,對於拼車服務公司等企業而言,這些功能也很有用。它們使用 Google Maps 平臺獲取接送時間信息並基於乘車時間估計價格。

DeepMind 研究者與 Google Maps 團隊展開合作,嘗試通過圖神經網絡等高級機器學習技術,提升柏林、雅加達、聖保羅、雪梨、東京和華盛頓哥倫比亞特區等地的實時 ETA 準確率,最高提升了 50%。下圖為這些城市的 ETA 提升率:

Google Maps 如何預測 ETA

為了計算 ETA,Google Maps 分析了世界各地不同路段的實時交通數據。這些數據為 Google Maps 提供了目前交通狀況的精確圖景,但是它卻無法幫助司機預計車程時間是 10 分鐘、20 分鐘,還是 50 分鐘。

所以,為了精確地預測未來交通狀況,Google Maps 使用機器學習將全球道路的實時交通狀況和歷史交通模式結合起來。這一過程非常複雜,原因很多。例如,早晚高峰每天都會有,但每一天、每一月的高峰期確切時間有很大不同。道路質量、限速、交通事故等因素也增加了交通預測模型的複雜度。

DeepMind 團隊與 Google Maps 合作嘗試提升 ETA 準確率。Google Maps 對超過 97% 的行程有著精確的 ETA 預測,DeepMind 與 Google Maps 的合作目的是將剩下那些預測不準確的情況最小化,例如臺中(Taichung)的 ETA 預測準確率提升了 50% 多。

為了在全球範圍內實現這一目的,DeepMind 利用了一種通用機器學習架構——圖神經網絡(GNN),通過向模型添加關係學習偏置來進行時空推理,進而建模現實世界道路網絡的連通性。具體步驟如下:

將世界上的道路分割為超級路段(Supersegment)

該團隊將道路網絡分割為包含多個鄰近路段的「超級路段」,超級路段都具有極大的交通流量。目前,Google Maps 交通預測系統包括以下組件:

路線分析器:具備數 TB 的交通信息,可用於構建超級路段;

新型 GNN 模型:使用多個目標函數進行優化,能夠預測每個超級路段的行程時間。

Google Maps 確定最優路線和行程時間的模型架構圖示。

用新型機器學習架構進行交通預測

利用超級路段創建估計行程時間的機器學習系統,所面臨的最大挑戰是架構問題。如何以任意準確率表示連接路段的規模可變樣本,進而保證單個模型也能預測成功?

DeepMind 團隊最初的概念證明始於一種簡單明了的方法,該方法儘可能地利用現有的交通系統,特別是已有的路網分割和相關的實時數據 pipeline。這意味著超級路段覆蓋了一組路段,其中每個路段都有特定的長度和相應的速度特徵。

首先,該團隊為每個超級路段訓練了一個全連接神經網絡模型。初步結果良好,表明神經網絡在預測行程時間方面是很有潛力的。但是,鑑於超級路段的可變規模,該團隊需要為每個超級路段單獨訓練神經網絡模型。要想實現大規模部署,則必須訓練數百萬個這樣的模型,這就對基礎設施構成了巨大的挑戰。

因此,該團隊開始研究能夠處理可變長度序列的模型,例如循環神經網絡(RNN)。但是,向 RNN 添加來自道路網絡的結構是很難的。於是,研究者決定使用圖神經網絡。在對交通情況進行建模時,車輛如何穿過道路網絡是該研究的關注點,而圖神經網絡可以對網絡動態和信息傳播進行建模。

該團隊提出的模型將局部道路網絡視為一個圖,其中每個路段對應一個節點,連接兩個路段(節點)的邊要麼在同一條道路上,要麼通過交叉點(路口)連接。在圖神經網絡中執行消息傳遞算法時,其傳遞的消息及其對邊和節點狀態的影響均由神經網絡學得。從這個角度看,超級路段是根據交通密度隨機採樣的道路子圖。因此,使用這些採樣的子圖能夠訓練單個模型,且單個模型可以進行大規模部署。

圖神經網絡通過泛化「相似度(proximity)」概念,擴展了卷積神經網絡和循環神經網絡所施加的學習偏置(learning bias),進而具備任意複雜度的連接,不僅可以處理道路前後方的交通情況,還可以處理相鄰和相交道路的情況。在圖神經網絡中,相鄰節點之間互相傳遞消息。在保持這種結構的情況下,研究者施加了局部偏置,節點將更容易依賴於相鄰節點(這僅需要一個消息傳遞步)。這些機制使圖神經網絡可以更高效地利用道路網絡的連通性結構。

實驗表明,將考慮範圍擴展到不屬於主要道路的相鄰道路能夠提高預測能力。例如,考慮小路上的擁堵狀況對大路交通情況的影響。通過跨越多個交叉路口,該模型能夠預測轉彎處的延誤、並道引起的延誤,以及走走停停交通狀況的通行時間。圖神經網絡在組合空間上的泛化能力使得該研究的建模技術具備強大能力。

每個超級路段的長度和複雜度可能各有不同(從簡單的兩段路到包含了數百個節點的較長路徑),但它們都可以使用同一個圖神經網絡模型進行處理。

從基礎研究到生產級機器學習模型

在學術研究中,生產級機器學習系統存在一個常常被忽視的巨大挑戰,即同一模型在多次訓練運行中會出現巨大的差異。雖然在很多學術研究中,細微的訓練質量差別可以簡單地作為 poor 初始化被丟棄,但數百萬用戶的細微不一致累加在一起就會產生極大的影響。

因此,在將該模型投入生產時,圖神經網絡對訓練中這種變化的魯棒性就成為了重中之重。研究者發現,圖神經網絡對訓練過程中的變化特別敏感,造成這種不穩定性的原因是訓練中使用的圖結構之間存在巨大差異。單批次圖可以涵蓋從兩節點小圖到 100 節點以上的大圖。

然而,在反覆試錯之後,研究者在有監督設置下採用了一種新型強化學習技術,解決了以上問題。

在訓練機器學習系統的過程中,系統的學習率決定了自身對新信息的「可塑性」。隨著時間推移,研究人員常常會降低模型的學習率,這是因為學習新東西和忘記已經學得的重要特徵之間存在著權衡,就像人類從兒童到成人的成長曆程一樣。

所以,在預定義訓練階段之後,研究者首先採用一種指數衰減學習率計劃來穩定參數。此外,研究者還探究和分析了以往研究中被證明有效的模型集成技術,從而觀察是否可以減少訓練運行中的模型差異。

最後,研究者發現,最成功的解決方案是使用 MetaGradient 來動態調整訓練期間的學習率,從而可以有效地使系統學得自身最優的學習率計劃。通過在訓練期間自動地調整學習率,該模型不僅實現了較以往更高的質量,而且還學會了自動降低學習率。最終實現了更穩定的結果,使得該新型架構能夠應用於生產。

通過自定義損失函數實現模型泛化

雖然建模系統的最終目標是減少行程預估中的誤差,但是研究者發現,利用多個損失函數(適當加權)的線性組合極大地提升了模型的泛化能力。具體而言,研究者利用模型權重的正則化因子、全局遍歷時間上的 L_2 和 L_1 損失、以及圖中每個節點的 Huber 和負對數似然(negative-log likelihood, NLL)損失,制定了一個多損失目標。

通過結合這些損失,研究者能夠指導模型並避免訓練數據集的過擬合。雖然對訓練過程的質量衡量標準並沒有變化,但是訓練中出現的提升更直接地轉化到留出(held-out)測試集和端到端實驗中。

目前,研究者正在探究,在以減少行程估計誤差為指導指標的情況下,MetaGradient 技術是否也可以用來改變訓練過程中多成分損失函數的構成。這項研究受到先前在強化學習中取得成功的 MetaGradient 的啟發,並且早期實驗也顯示出了不錯的結果。

參考內容:https://deepmind.com/blog/article/traffic-prediction-with-advanced-graph-neural-networks

相關焦點

  • 微軟實現深層神經網絡重大技術突破
    日前,微軟亞洲研究院視覺計算組在2015 ImageNet計算機識別挑戰賽中憑藉深層神經網絡技術的最新突破,以絕對優勢獲得圖像分類、圖像定位以及圖像檢測全部三個主要項目的冠軍。  據了解,在此次挑戰賽中,微軟亞洲研究院的研究團隊使用了一種前所未有的深度高達百層的神經網絡,這比以往任何成功使用的神經網絡層數多5倍以上,從而在照片和視頻物體識別等技術方面實現了重大突破。  事實上,該研究團隊早在今年一月就首先實現了對人類視覺能力的突破。
  • 中科院計算所研究團隊提出圖神經網絡加速晶片設計
    讓機器「會思考」 設計中「增引擎」圖神經網絡被認為有望解決深度學習無法處理的關係推理、可解釋性等一系列問題,讓機器「能理解、會思考」。然而由於圖神經網絡在圖數據處理方面的特殊性,傳統用於加速神經網絡的晶片難以直接對圖神經網絡的執行提供高效計算支撐。
  • 準確率至上已是過去式,這些趨勢在2020年的AI領域更受關注
    「這些框架使研究者的速度比之前快了一兩個數量級,從這個角度看,這是一項巨大突破。」2019 年,谷歌和 Facebook 的開源框架都引入了量化,用於提升模型訓練速度。Chintala 預測,2020 年 PyTorch 的 JIT 編譯器和神經網絡硬體加速器(如 Glow)等工具的重要性和採用範圍將迎來「爆發」。
  • 谷歌重磅開源新技術:5行代碼打造無限寬神經網絡模型
    但是,問題來了:推導有限網絡的無限寬度限制需要大量的數學知識,並且必須針對不同研究的體系結構分別進行計算。對工程技術水平的要求也很高。谷歌最新開源的Neural Tangents,旨在解決這個問題,讓研究人員能夠輕鬆建立、訓練無限寬神經網絡。
  • 中科院計算所提出全球首款圖神經網絡加速晶片設計
    「作為近年來新興的一種智能算法,圖神經網絡不僅在學術界被高度重視,也已然成為近年來工業界非常重要的應用之一。」嚴明玉介紹說,圖神經網絡能夠備受學術界和工業界的青睞,歸功於其強大的數據和知識理解能力,以及關係推理能力。  由於圖神經網絡在圖數據處理方面的特殊性,傳統用於加速神經網絡的晶片難以直接對圖神經網絡的執行提供高效計算支撐。
  • 谷歌地圖安卓版下載
    啥,沒時間,不怕,谷歌地圖安卓版下載滿足你,快來下載體驗吧。 谷歌地圖是一款由Google公司推出的電子地圖服務手機app。通過ta,你能免費獲得所有地圖、行車路線、商店、飯館或者其他地點的地理位置,便捷獲取營業時間,聯繫方式等實用信息,省時省力又省心。
  • 圖神經網絡逆勢而上,7日學懂入門圖
    你一定不會忽略它——圖神經網絡。 相比傳統神經網絡,圖神經網絡的優勢非常明顯: 1、非順序排序的特徵學習:GNN的輸出不以節點的輸入順序為轉移的。 2、兩個節點之間依賴關係的學習:傳統的神經網絡中,這種依賴關係只能通過節點的特徵來體現。 3、推理能力:GNN能夠從非結構化數據(例如:場景圖片、故事片段等)中生成推理圖。
  • 谷歌用β-LASSO武裝MLP,縮小與卷積網絡的差距
    多層感知機(MLP)在 CIFAR-10 數據集上的最高準確率是多少?65%?那是之前。谷歌新研究用 LASSO 算法的變體 β-LASSO 武裝 MLP,將其在 CIFAR-10 數據集上的準確率提升到 85%。
  • ERNIE加持,飛槳圖神經網絡PGL全新升級
    最新算法突破:結合語義與結構信息的圖神經網絡模型 ERNIESage在很多工業應用中,往往出現如下圖所示的一種特殊的圖:Text Graph。顧名思義,圖的節點屬性由文本構成,而邊的構建提供了結構信息。
  • 推出圖神經網絡屠榜「必殺技」UniMP
    9月18日,百度正式公布在圖神經網絡領域取得新突破,提出融合標籤傳遞和圖神經網絡的統一模型UniMP(Unified Message Passing),在圖神經網絡權威榜單OGB(Open Graph Benchmark)取得多項榜首,引發業界關注。  Leaderboard for ogbn-products
  • 74KB圖片也高清,谷歌用神經網絡打造圖像壓縮新算法
    最新的好消息是,谷歌團隊採用了一種GANs與基於神經網絡的壓縮算法相結合的圖像壓縮方式HiFiC,在碼率高度壓縮的情況下,仍能對圖像高保真還原。  GAN(Generative Adversarial Networks,生成式對抗網絡)顧名思義,系統讓兩個神經網絡相互「磨鍊」,一個神經網絡負責生成接近真實的數據,另一個神經網絡負責區分真實數據與生成的數據。  簡單來說,就是一個神經網絡「造假」,另一個神經網絡「打假」,而當系統達到平衡時,生成的數據看起來便會非常接近真實數據,達到「以假亂真」的效果。
  • MIT韓松專訪:Once for All 神經網絡高效適配不同硬體平臺
    Once-for-All: Train One Network and Specialize it for Efficient Deployment論文詳情(來源:AMiner 會議智圖開放平臺 ICLR 2020 專題全析圖) 這篇論文的主要內容,是通過一種 Once for All 網絡,可高效生成 10^19 獨立工作的子網絡以便適配到不同的硬體平臺
  • 專欄| 神經網絡架構搜索(NAS)綜述(附AutoML資料推薦)
    ,常規的 random search 和 grid search 效率非常低,因此最近幾年神經網絡的架構搜索和超參數優化成為一個研究熱點。比如:移動端的模型結構優化,既希望得到儘量高的準確率,又希望有非常好的模型計算效率。搜索空間搜索空間定義了優化問題的變量,網絡結構和超參數的變量定義有所不同,不同的變量規模對於算法的難度來說也不盡相同。
  • 神經網絡加持,即時拍照翻譯哪家強?
    在谷歌新一輪的更新之後,即時相機翻譯再次進化,支持語種數量達到了88種,可譯語言更是超過了100種。以前的版本還只支持中英文互譯,現在,無論是日語韓語馬來語,還是法語德語阿拉伯語,通通都能在相機裡直接顯示成中文。甚至沒有網絡,也依然好用。
  • 神經網絡引擎 蘋果晶片專題及常見問題 - CSDN
    上一代A10的單核性能平均3332,多核性能平均5558,提升30%和50%。而高通驍龍835的GeekBench成績為單核2000左右,多核6500左右,蘋果A11吊打安卓旗艦晶片。 A11是一款人工智慧晶片A11 Bionic晶片上搭載的「神經網絡引擎」是一個專用於機器學習的硬體,這個神經網絡引擎跟麒麟970的NPU一樣,是在手機處理器平臺新加入的一個擅長神經網絡計算的硬體模塊。
  • 華為,為了替代谷歌地圖,推出新地圖服務WeGo
    搭載'HERE'的WeGo華為為了替代谷歌地圖,開始了新的地圖服務。由於無法獲得谷歌的服務支持,導致華為在海外的佔有率受到影響。根據國內媒體C114的消息,華為為了尋求替代谷歌移動服務(GMS)的谷歌地圖,推出了地圖服務公司(HERE)的「WeGo」地圖服務。
  • 完全使用憶阻器實現CNN,清華大學微電子所新研究登上Nature
    他們構建的基於憶阻器的五層 CNN 在 MNIST 手寫數字識別任務中實現了 96.19% 的準確率,為大幅提升 CNN 效率提供了可行的解決方案。基於憶阻器的神經形態計算系統為神經網絡訓練提供了一種快速節能的方法。但是,最重要的圖像識別模型之一——卷積神經網絡還沒有利用憶阻器交叉陣列的完全硬體實現。
  • 專欄| 十年角力,谷歌地圖最終關閉出局
    2011年6月30日,是國家測繪局對網際網路地圖牌照設立的「生死時限」;但7月上旬時候,未獲牌的谷歌地圖在華依舊正常運營在7月1日之前的國家測繪地理信息局2次通報名單中,谷歌地圖並不在公開曝光之列,谷歌地圖未出現在國家測繪局兩次無網際網路地圖服務資質的通報名單中。
  • 如何到達谷歌搜索的頂部 [互動指南]-megalithant
    如何通過 ads 達到谷歌頂部 如果你已經在目標關鍵字的搜索結果頂部看到廣告,那麼出現在谷歌頂部的唯一方法就是付費廣告。 怎麼做?只需註冊 Google ads 並建立搜索廣告系列就可以實現。 如何通過本地化SEO到達谷歌頂部 如果人們在谷歌中尋找本地商家,那麼你通常會在結果頂部看到一個 「地圖板塊」。 與大多數搜索結果不同,地圖板塊表會讓你進入 Google My Business 的列表,而不是其網站。
  • 華為諾亞、北大提出GhostNet,使用線性變換生成特徵圖,準確率超...
    引言深度卷積神經網絡在諸如目標識別,目標檢測,實例分割等任務上都取得了很大的進步。為了獲得更好地準確率表現,傳統的卷積神經網絡需要大量的參數和浮點運算,在ResNet-50中,大約有25.6M的參數,如果需要處理一張224x224的圖片,需要的浮點數計算有4.1B。