處理移動端傳感器時序數據的深度學習框架:DeepSense

2021-01-05 機器之心Pro

DeepSense 是一種在端設備上運行的深度學習框架,它可以在本地獲取需要處理的傳感器數據,並且在不上傳到雲端的情況下對這些數據應用深度學習模型,如卷積神經網絡或門控循環神經網絡等。

DeepSense 是一種在行動裝置上運行的深度學習框架,可以根據來自移動傳感器(例如,運動傳感器)的數據進行回歸和分類任務。分類任務的一個例子是異構人體活動識別(HHAR),即基於運動傳感器測量數據來檢測某人可能在進行哪些活動(步行,騎車,站立等等)。另一個例子是生物特徵運動分析,即從步態識別出用戶。回歸任務的一個例子是利用加速度測量數據來跟蹤汽車的位置並推斷汽車以後的位置。

與最先進的框架相比,DeepSense 特別提供了一個估計量(estimator),該估計量的跟蹤誤差遠小於汽車跟蹤問題的誤差,並且明顯優於 HHAR 和用戶識別任務方面的最先進的算法。

儘管我們一般將多數行動應用程式轉移到遠程雲處理,但是轉移過程對時間延遲要求很高,而且高傳感器採樣頻率(如加速器,陀螺儀)導致數據傳輸難以支撐,因此我們更希望在本地設備上執行大型傳感器任務。因此,我們通過在兩種不同類型的智能設備上針對所有三項任務的適度能耗和低開銷進行測試,展現了在行動裝置上實現和部署 DeepSense 的可行性。

對於許多潛在的應用程式來說,本地處理也是保護隱私的一個重要組成部分。所以現在很多研究者對於這種端設備上的深度學習很感興趣。本文作者深入了解了 DeepSense 的工作原理,並重點給我們介紹該框架的核心網絡設計,其餘的評估細節等我們應該很容易從論文中找到。

處理單傳感器數據

我們先考慮單個傳感器(最終我們希望構建應用程式,將多個傳感器的數據組合起來)。單傳感器可以提供多維測量,例如運動傳感器,它會沿著 x、y 和 z 軸報告運動。我們每隔一段時間(即時間序列)收集這三個維度中的傳感器讀數,我們可以用如下形式表示:

我們要在寬度為τ的非重疊窗口中處理數據。將時間序列樣本中的數據點數除以τ可以得到總的窗口數。例如,如果我們有 5 秒的運動傳感器數據,並打算將它們劃分為持續 0.25 秒的窗口,那麼我們將得到 20 個窗口。

在頻率維度上對時間序列數據中尋找模式比在時間維度上更好,所以下一步是將 T 窗口中的每一個小窗口通過傅立葉變換傳遞給 f 頻率分量(frequency components),每個頻率分量具有大小和相位。每個窗口得到一個 d x 2f 階的矩陣。

我們有了這些 T,就可以將所有數據打包到一個 d x 2f x T 的 3 階張量。

將所有的信息都很好地封裝在單個張量中這一點是很方便實現的,但實際上我們將在 t 維中逐層處理(一次一個窗口)。每個 d x 2f 窗口切片通過卷積神經網絡組件包括三個階段,如下圖所示:

首先,我們使用二維卷積濾波器捕捉局部頻率域各維度之間的交互。然後輸出通過一維卷積濾波器層來捕獲高級關係。最後一個濾波器層的輸出被展平以產生傳感器特徵向量。

整合多傳感器數據

按照上述應用程式使用每 K 個傳感器的流程。我們現在有了 K 個傳感器特徵向量,我們可以把它打包成一個具有 K 行的矩陣。

然後傳感器特徵矩陣通過與我們剛剛看到結構相同的第二個卷積神經網絡組件傳送。也就是說,二維卷積濾波層後面是兩個一維向量層。最後,我們將最後一個濾波器的輸出壓平為整合後的傳感器特徵向量。窗口寬度τ附加在在該矢量的末端。

對於每個卷積層,DeepSenses 學習 64 個濾波器,並使用 ReLU 作為激活函數。另外,在每層施加批量歸一化以減少內部協變量(covariate)的變化。

現在一個時間窗口有組合的傳感器特徵向量。並且我們需要對所有 T 窗口重複上述過程。

所以現在我們有 T 個組合的傳感器特徵向量,每個都學習窗口內的相互作用。當然,跨時間窗口學習窗口之間的關係也很重要。為了做到這一點,T 特徵向量被饋送到 RNN 中。關於這一點,我想我們已經準備好了一張示例圖來說明問題。

作者在 RNN 層中採用了門控循環單元(GRU)而不是 LSTM。

GRU 在各種任務中表現出與 LSTM 相似的性能,同時具有更簡單的結構,這降低了行動應用程式的網絡複雜性。

DeepSense 使用兩層的堆疊式 GRU 結構。當有新的時間窗口時,此結構可以逐增地(incrementally)運行,從而更快地處理流式數據。

將其全部數據輸出到輸出層

循環層的輸出是一系列 T 向量,每個時間窗口一個 T 向量。

對於回歸類任務(例如,預測汽車位置),輸出層是所有向量之上的全連接層,這些全連接層共享用於學習的權重和偏置項,從而學習。

對於分類任務,將單個矢量組成一個固定長度的單矢量以便進一步處理。我們可以使用類似注意力網絡學習的加權平均值一樣的技巧,但是在本文中,通過取時間的平均值(累加向量並除以 T)可以獲得優異的結果。最終特徵向量被傳送到 softmax 層以生成最終類別預測分數。

自定義目前的應用程式

遵從以下步驟將 DeepSense 打磨成適合特定的移動測繪和計算任務的系統:

確定傳感器的輸入個數 k,將輸入預處理到一組 d x 2f x T 張量中。確定任務類型並選擇合適的輸出層。可選擇自定義成本函數。回歸任務的默認成本函數是均方誤差,分類任務默認的成本函數是交叉熵誤差。

對於評估中的活動識別(HHAR)和用戶識別任務,使用默認成本函數。對於汽車位置跟蹤任務,使用負對數似然函數(詳見 4.2 節)。

主要成果

以下是 DeepSense 相對於傳感器融合和 eNav 算法在汽車跟蹤任務上的準確度。地圖輔助準確度欄顯示了位置被映射到地圖最近道路段時得到的準確度。

DeepSense 在 HHAR 任務上優於其它方法 10%。

在用戶識別任務上優於其它方法 20%。

我們通過三個具有代表性的移動端測量任務評估了 DeepSense,DeepSense 的性能遠遠高於現有頂尖技術的基準,同時仍然通過在移動和嵌入式平臺上適度的能耗和低延遲的表現證明其移動端部署的可行性。

評估任務主要集中在運動傳感器上,但該方法還可以應用於許多其他類型的傳感器,包括麥克風、路由器、氣壓計和光傳感器等。

相關焦點

  • 百度開源移動端深度學習框架mobile-deep-learning(MDL)
    2017 年 9 月 25 日,百度在 GitHub 開源了移動端深度學習框架 mobile-deep-learning(MDL)的全部代碼以及腳本,希望這個項目在社區的帶動下能夠更好地發展。寫在前面深度學習技術已經在網際網路的諸多方向產生影響,每天科技新聞中關於深度學習和神經網絡的討論越來越多。
  • AI開發者看過來,主流移動端深度學習框架大盤點
    雷鋒網按:行動裝置相較於 PC ,攜帶便攜,普及率高。近年來,隨著行動裝置的廣泛普及與應用,在行動裝置上使用深度學習技術的需求開始湧現。簡書作者 dangbo 在《移動端深度學習展望》一文中對現階段的移動端深度學習做了相關展望。
  • Keras vs PyTorch:誰是第一深度學習框架?
    【IT168 資訊】「第一個深度學習框架該怎麼選」對於初學者而言一直是個頭疼的問題。本文中,來自 deepsense.ai 的研究員給出了他們在高級框架上的答案。在 Keras 與 PyTorch 的對比中,作者還給出了相同神經網絡在不同框架中性能的基準測試結果。
  • 小米發布移動端深度學習框架 MACE Micro
    、減輕後臺伺服器的壓力,同時儘量把問題在端上解決,把用戶數據留在端上也能減少安全風險,讓用戶對數據隱私安全更放心。」AI賦能物聯網終端在11月5日召開的第四屆小米開發者大會上,小米移動端深度學習框架MACEMicro發布。這是小米單獨為小規模IoT產品打造的AI引擎。據介紹,MACEMicro的代碼量低至數百KB,傳感器和處理器功耗均小於1毫瓦,成本低至0.1美元,將在極低功耗和成本情況下使得IoT設備更加智能化。
  • 小米要做移動端最牛叉的深度學習框架
    小米要做移動端最牛叉的深度學習框架 李倩 發表於 2018-07-03 11:53:19 小米要做移動端最牛叉的深度學習框架。
  • 百度開源移動端深度學習框架MDL,可在蘋果安卓系統自由切換
    雷鋒網 AI科技評論消息,日前,百度在 GitHub 上開源了移動端深度學習框架mobile-deep-learning(MDL)的全部代碼以及腳本,這項研究旨在讓卷積神經網絡(CNNC)能更簡單和高速的部署在移動端,支持iOS GPU,目前已經在百度APP上有所使用。
  • DeepMind 一次性開源 3 個新框架!深度強化學習應用落地即將迎來...
    雷鋒網 AI 開發者按:深度強化學習(Deep Reinforcement Learning,DRL)一直是近年來人工智慧的一些重大突破的核心。然而,儘管 DRL 有了很大的進步,但由於缺乏工具和庫,DRL 方法在主流解決方案中仍然難以應用。因此,DRL 仍然主要是以研究形式存在,並沒有在現實世界看到許多採用機器學習的應用方案;而解決這個問題就需要更好的工具和框架。
  • 深度學習在物理層信號處理中的應用研究
    據IBM報導,移動數據量到2020年將超過40萬億Gbits,比2009年增加44倍,連接總設備量將達到500億。為了滿足這一需求,需要新的通信理論和創新技術來滿足5G系統的需求。近些年深度學習範式的發展使引起了學術界和工業界對基於深度學習的無線通信技術的研究,研究結果證實了深度學習技術可以提高無線通信系統的性能,並有潛力應用在物理層進行幹擾調整、信道估計和信號檢測、信號處理等方面。
  • DeepMind悄咪咪開源三大新框架,深度強化學習落地希望再現
    作者 | Jesus Rodriguez譯者 | 夕顏【導讀】近幾年,深度強化學習(DRL)一直是人工智慧取得最大突破的核心。儘管取得了很多進展,但由於缺乏工具和庫,DRL 方法仍難以應用於主流的解決方案。因此,DRL 主要以研究形式存在,並未在現實世界的機器學習解決方案中得到大量應用。解決這個問題需要更好的工具和框架。
  • AI 四巨頭 Google、DeepMind、Microsoft、Uber 深度學習框架大比拼
    編者按:Google、Uber、DeepMind和Microsoft這四大科技公司是當前將深度學習研究廣泛應用於自身業務的典型代表,躋身全球深度學習研究水平最高的科技公司之列。GPipe、Horovod、TF Replicator和DeepSpeed分別是這四家公司開發應用的深度學習框架,它們結合了深度學習研究及其基礎設施的前沿技術,以提高深度學習模型的訓練效率。
  • 應對端側部署深度學習巨大挑戰,解密小米深度學習框架MACE
    本文來自PaperWeekly和biendata組織的企業AI技術實戰講座,詳細介紹了小米公司的深度學習在端側落地的機遇與挑戰,以及專為移動端優化的深度學習框架MACE。作者李濱,小米AI實驗室工程師。
  • 掌握深度學習,為什麼要用 PyTorch、TensorFlow 框架?
    畢竟,許多數據集可以用解析方法或簡單的統計過程進行建模。另一方面,在某些情況下,深度學習或深度遷移學習可以幫助你訓練更準確的模型。在這些情況下,你可以考慮使用PyTorch和TensorFlow,特別是如果你所需的訓練模型與其中一個框架模型庫中的模型類似。PyTorchPyTorch建立在舊版的Torch和Caffe2框架之上。
  • 深度學習框架 PyTorch 為何值得學
    2018 年 10 月,PyTorch V 1.0.0 發布,融合 PyTorch 自身靈活性、研究優勢與 Caffe2 的後端與應用能力、ONNX 的框架轉換能力於一體;同時 FastAI V1.0 發布,可用單一 API 玩轉常見深度學習應用,大大降低了深度學習的學習門檻。
  • ​大牛的《深度學習》筆記,Deep Learning速成教程
    深度學習,即Deep Learning,是一種學習算法(Learning algorithm),亦是人工智慧領域的一個重要分支。從快速發展到實際應用,短短幾年時間裡,深度學習顛覆了語音識別、圖像分類、文本理解等眾多領域的算法設計思路,漸漸形成了一種從訓練數據出發,經過一個端到端(end-to-end)的模型,然後直接輸出得到最終結果的一種新模式。那
  • 阿里開源的深度學習框架XDL,究竟如何理解?
    遠的不說谷歌的TensorFlow,國際上比較流行的PyTorch、Caffe或者Theano,國內之前百度也早就發布了深度學習框架PaddlePaddle,能夠處理和進行大規模高維稀疏數據學習訓練。在學術界,也有各類機構比如北大機器學習的馬超博士研究團隊公布的開源的大規模稀疏數據機器學習庫xLearn。
  • 晶片公司必須得有深度學習框架!清華研發出深度學習編譯框架
    相比 CPU/GPU 等傳統架構,神經網絡處理器可將 AI 算法的計算能效提高 1~2 個數量級,目前其已在行動裝置、可穿戴設備、智能傳感器等應用場景中獲得廣泛的應用。現有的深度學習編譯框架,如 TVM、TensorRT 等僅針對網絡中的某些特定模式進行優化,它們沒有處理任意結構的能力,因此未能有效解決上述難題。
  • Nature Neurosci: 神經科學的深度學習框架是什麼?
    Blake Richards組織一眾科學家在Nature Neuroscience上發文,「A deep learning framework for neuroscience」正是回答這個問題。為什麼建立神經科學的深度學習框架,神經科學的深度學習框架的內容(是什麼),我們應該如何在深度學習框架下發展神經科學(怎麼做)。
  • 深度學習框架比較,我該選擇哪一個?
    ,十分適合與其它深度學習庫結合起來進行數據探索。基於簡單,靈活的設計,Pytorch快速成為了學術界的主流深度學習框架。,支持千億規模參數、數百個幾點的高效並行訓練,也是最早提供如此強大的深度學習並行技術的深度學習框架。
  • 通過對比深度學習各大框架的優缺點尋找最優
    開源的深度學習神經網絡正步入成熟,而現在有許多框架具備為個性化方案提供先進的機器學習和人工智慧的能力。那麼如何決定哪個開源框架最適合你呢?本文試圖通過對比深度學習各大框架的優缺點,從而為各位讀者提供一個參考。你最看好哪個深度學習框架呢?
  • 一代深度學習框架研究
    ,簡述深度學習發展歷程以及目前的挑戰,通過介紹新一代深度學習框架的特點,分析總體框架,闡述自動並行、自動微分、自動調優等技術優勢以及協同昇騰處理器的性能優勢,希望可以為深度學習技術研究人員提供參考。深度學習的研究和應用在近幾十年得到了爆炸式的發展,並且已經在圖像識別、語音識別、機器翻譯以及遊戲等方面取得了巨大的成功。為了獲得更好的性能,深度學習的網絡結構日益複雜,網絡深度和數據集也日益增大,這給深度學習的計算框架帶來了巨大的挑戰。