本文首發於 5G工業物聯。
【摘要】基於邊緣計算研究傳感器高頻次採集數據的傳輸、存儲和處理技術架構,提出了傳感器高頻採集設備的軟硬體模塊組成,並形成通用數據分析處理軟體框架,以長時間綜合分析多個高頻採集設備的數據,為物聯網應用對大規模傳感器數據進行挖掘處理和分析判決提供基礎。
【關鍵詞】邊緣計算;大規模傳感器;高頻採集
1 引言
物聯網是通過智能感知、識別技術與普適計算、泛在網絡的融合應用,在5G的萬物互聯時代,物聯網要通過大規模的不同類型的傳感器去感知周邊物體和物理環境,為物聯網應用層的數據分析提供依據。傳感器採集系統實時監測、感知和採集各種環境或監測對象信息,實現物理世界多種元素、信息空間以及人類社會之間的交流,不同規模,不同採集頻率對傳感器採集系統的要求不一樣,對大規模傳感器進行高頻次採集,要求傳感器採集系統具備大範圍高帶寬的實時傳輸、計算、存儲和處理能力,統—集中式的雲計算模式無法滿足此要求,多接入邊緣計算(Muti-access Edge Computing, MEC)技術的出現才使其成為可能。
多接入邊緣計算MEC是一種在物理上靠近數據生成位置的處理數據的方法,是5G的關鍵技術之一[1]。邊緣計算通過使業務靠近網絡邊緣擴展了雲計算能力,在5G網絡中,被認為是能高效處理大量業務數據,滿足用戶對業務需求的有效技術之一。
大規模傳感器高頻採集系統將傳感器技術、現代網絡及無線通信技術、分布式信息處理技術、大規模信息處理系統等多項先進技術集中應用,基於邊緣計算,通過研究大規模高頻率採集傳感器數據情況下傳感器數據傳輸、存儲、處理和展示技術,開發一套通用的大規模高頻採集數據分析處理軟體,長時間持續綜合分析多個高頻採集設備的數據,並提供二次開發接口,為傳感器數據進一步挖掘處理提供基礎,可為傳感器採集系統的發展和應用推廣提供更廣闊的平臺。
2 國內外研究現狀和趨勢
常見傳感器(如溫溼度、水量等)採集系統規模通常較小,覆蓋區域集中在企業內部,其採集時間通常不超過毫秒級,也即採集頻率為1000Hz以下;相對而言,大規模傳感器高頻採集系統其覆蓋區域廣(行政區一級以上區域),涉及數量多(大於1000個以上),採集頻率高(大於1000Hz以上)。
從國內外已有的相關研究來看,在國家、省、市相關物聯網的項目中,雖全方位地涵蓋了低速和中高速傳感器網絡的體系結構、自主組網和通信協議、數據融合與管理、應用示範和測試等研究內容,但大都基於對傳感器數據進行低頻率採集,對高頻率採集的相關研究不多。
市場上的物聯網相關廠家尚在集中精力於傳輸協議的研究和設備的研製,以及監控系統的開發,也是基於低頻次採集的,對大規模的高頻次採集傳感器數據處理分析技術未見報導。
對高頻傳感器採集進行分析的產品硬體有測量儀器,軟體有NI公司的Labview,這些都是少量幾個通道的短時間直接分析,未有長時間的多設備的持續綜合數據分析。
在電力、管網、地震、環境等監測應用中,都有對大範圍高密集的傳感器進行長時間高頻次採集監測的需求,有必要對此開展相關研究。
3 基於邊緣計算的大規模傳感器高頻採集系統
大規模傳感器高頻採集系統具有如下特點:
(1)採集數據量大:採樣精度和頻率高,單位時間內採集的數據量大;
(2)數據傳輸帶寬:要傳輸的傳感器數據量大,必須要求網絡帶寬高;
(3)存儲線性增加:單個傳感器的採集數據隨時間線性增長;
(4)採集時間同步:存在不同的採集設備之間的時間同步問題;
(5)系統規模大:系統需要綜合分析多個傳感器的數據才能得到有意義的結果;
(6)計算處理要求高:由於需要對數據進行信號分析,濾波等處理,計算量非常大。
針對系統特點需求,首要研究大規模傳感器高頻採集系統體系結構和相關實現技術,研究大規模高頻率採集傳感器數據情況下傳感器數據傳輸、存儲、處理分析和展示技術。
其次要研製一款傳感器高頻採集設備作為系統的數據源,開發一個大規模高頻採集數據分析處理軟體以供傳感信息查看和管理,基於邊緣計算構建一個大規模高頻採集數據服務平臺進行傳感數據的上傳、存儲、計算和分析。
下面從網絡體系結構、中心平臺架構、高頻採集設備硬體組成和軟體框架、相關關鍵技術和系統應用場景幾個方面進行論述。
3.1 網絡體系結構
如圖1所示,大規模傳感器高頻採集系統是由高頻採集設備、分布式MEC在線計算伺服器和集中式雲端中心服務平臺組成。高頻採集設備實時高頻次收集傳感器監測數據,通過4G/5G移動網或固網傳送至分布式MEC在線計算伺服器進行處理,分布式MEC在線計算伺服器再把原始數據和計算結果傳輸到集中式雲端中心服務平臺,在服務平臺中數據上傳集群接收傳感器數據流,存儲到數據存儲倉庫。
圖1 系統體系結構圖
系統採用分布式架構,充分利用MEC計算伺服器的高性能運算能力,對異構數據實施高效的存儲、管理、同化、分析與信息發現,以實現高可信度的實時預警決策。其中,數據存儲和管理涉及異構數據整合和數據倉庫設計;異構數據同化、分析和信息發現則是評估與預警服務的關鍵。
3.2 中心服務平臺架構
如圖2所示,中心服務平臺由數據上傳集群、離線分析集群、分布式計算集群、數據存儲倉庫和應用服務集群組成。
圖2 平臺架構圖
多個高頻採集設備採集的數據通過網絡(乙太網、移動通信網、無線網絡等)上傳到MEC在線計算伺服器,MEC在線計算伺服器形成的分布式計算集群實時對原始數據進行壓縮傳輸、整形清洗等預處理,產生相關頻譜等計算結果,原始數據和計算結果都傳送到數據上傳集群,由數據上傳集群進行分片接收處理,存儲到數據存儲倉庫,更新業務資料庫中的數據索引。
用戶、維護和管理人員訪問應用服務集群,從業務資料庫獲取設備和數據索引信息,當查看波形、頻譜等傳感信息時,由應用服務集群請求分布式計算計算集群進行計算,計算結果由應用服務集群返回給客戶端。
離線分析集群通過構建數據分析模型,對採集的高頻次傳感器原始數據和計算結果進行多角度分析、深度挖掘學習和綜合分析處理,以得到有意義的結果,同時能生成分析報告,供管理者決策。當大量傳感數據具備空間地理信息之後,並結合入GIS系統之後,使得結合空間地理信息的實現多角度多面向個性化的傳感信息分析模式成為可能。通過數據挖掘及模式匹配、多樣化輸出模式及圖形化控制終端系統設計,對傳感數據結合空間地理信息數據進行管理和計算,能直觀詮釋空間、時間及各感知信息之間的相互關係。
在數據上傳和客戶端訪問的前端,都通過負載均衡來實現對高並發訪問的分流控制。
3.3 高頻採集設備組成
如圖3所示,設備由多個模塊組成,高精度時鐘模塊經校準後,為設備提供高精度的時間同步功能;移動通信模塊支持與4G/5G行動網路進行通信;傳感器網絡通信模塊具備協議棧處理功能,提供與低速/高速傳感器網絡及設備的通信,並通過總線(SPI)與主處理器相連;WiFi模塊提供到無線區域網的接入能力;信息顯示模塊為設備提供圖形化信息顯示;外部採控提供高頻採集設備連接多種傳感器的接口,並進行接口轉換和防護處理;GPS/北鬥模塊提供設備位置信息;數據處理和控制模塊為高頻採集設備提供高性能的處理能力;電源模塊為設備所有其它模塊供電。
圖3 硬體組成圖
3.4 高頻採集設備軟體框架
如圖4所示,軟體布署在數據處理和控制模塊中,數據服務完成高頻採集傳感器數據的匯聚與傳輸,實現傳感網數據到無線區域網、移動通信網絡、有線網絡的傳輸。
圖4 設備軟體框架圖
採集控制實現外部採控接口中傳感器數據的高頻採集。協議管理實現對傳感器網絡的管理,實現RS-485 Modbus RTU、Modbus TCP應用協議支持;參數配置功能實現管理中心對設備參數進行配置,通過RJ45或USB進行配置。
TCP/IP協議棧提供網絡通信支持。WiFi協議棧提供無線區域網通信。4G/5G通信RIL框架提供行動網路通信框架。傳感器網絡通信接口實現與傳感器網絡的信息交互,實現傳感網數據的匯聚和控制指令的分發。
作業系統提供應用軟體的平臺支持。
驅動提供對硬體的抽象接口。包括:SPI、LAN、UART、USB、4G模塊、GPIO、AD/DA、I2C、WiFi、LCD顯示、按鍵、傳感器驅動。
3.5 大規模高頻釆集數據分析處理軟體
如圖5所示,數據分析處理軟體使用組態軟體架構,把處理、顯示、分析等模塊分離,易於修改顯示方式和增加分析處理功能。
圖5 分析處理軟體框架圖
分析處理軟體包括底部驅動程序,通訊協議等與設備配套使用的控制軟體,自動識別設備配置,遠程設置設備的量程、濾波及採樣參數,完成信號的實時採集分析處理。
控制界面提供設備識別、參數配置、實時採集、數據預處理、格式轉換及數據保存功能。分析界面提供時差域、幅值域、頻率域和相關分析功能。
決策界面部分,通過長時間統計分析,多設備綜合計算,對結果進行數據可視化顯示,生成決策報告,並提供在線操作幫助。
4 關鍵技術
4.1 採集時間同步技術
時間同步是對多傳感器綜合分析的前提,需要在統一的時間軸上,方可通過傳感器數據時間分析多傳感器之間的相關性。可通過兩種途徑保證傳感器數據的同時性(誤差在較小範圍),一是採集設備統一使用GPS授時,結合自身的高精度時鐘持續採集;二是由分布式MEC在線計算伺服器校正傳感器數據時間。
4.2 傳感數據空間可視化技術
基於高頻次採集的大量實時數據,以及傳感器的位置信息,可實時在GIS空間信息上顯示相關區域的傳感信息,通過提供一系列的分析和處理的手段,使用戶直觀的獲得相關可視化分析結果。
可視化要求能對被傳感器採集系統覆蓋區域進行空間數據查詢,同時獲得對應的傳感採集數據信息。系統需提供可拖動時間軸,獲取相關區域的歷史傳感信息,或獲取指定區域的歷史環境的變化過程圖。
要實時在GIS中顯示某區域的傳感器數據,其難點在於接收、解析及處理遠程採集設備的地理位置信息及傳感信息,在大數據吞吐量下須具備高可靠性。歷史數據可視化回放的難點在於允許用戶可以通過拖拉滾動條或者指定時間範圍自動播放,還原指定區域環境信息歷史的走向。
可視化分析則要求系統能對用戶指定的服務端接收到的原始數據進行自定義的可視化分析處理,包括簡單的數學運算、複雜的聚類、模式匹配等數據處理。
4.3 高頻傳感數據壓縮技術
傳感器採集的數據具有一定的冗餘,通過數據融合技術可提高數據收集的效率和準確性。傳統的數據融合技術優先考慮節省能量,為融合儘量多的合併數據包,降低數據傳輸量,通常會犧牲數據包的傳輸延時。
由於高頻採集的傳感器數據量大、實時性要求高,需研究在滿足時間性和信息完整性的要求下,對大量的信息進行編碼融合,以減少傳輸帶寬並壓縮存儲。數據融合機制需根據信息與業務的實時性要求選擇不同的數據融合度,且能根據網絡各層協議的信息,調整數據融合的融合度、緩存大小、融合等待時間等參數,在節省能量和傳輸速度方面達成平衡。
4.4 高頻傳感器數據儲存方式
高頻傳感器採集的數據量大,數據流有連續和間斷的,數據量隨時間的增加而線性增長,在分布式MEC在線計算伺服器及數據存儲倉庫中,必須設計特定的存儲結構存儲,方便插入和查詢。通過把間斷分散的高頻傳感器數據片按時間順序整理成連續的數據流,方便進一步的查看和處理。
4.5 實時分析處理架構研究
高頻採集設備上傳的傳感器數據經過整形等預處理過程寫入數據存儲倉庫的同時,必須實時計算出波形、頻譜等圖形推送給客戶端查看。由於傳感器數量多,分布式MEC在線計算集群必須在短時間內計算出大量的傳感器圖形,就需要研究並發度高,計算速度快的系統架構及算法。
4.6 數據融合與挖掘技術
數據挖掘在時間節點上包括以下層面:對已有資料庫,通過專家知識建立數據挖掘的算法基礎和相應的挖掘引擎,挖掘出相應的數據模式;在採集信號異常時,通過待分析數據和經驗數據模式的數據比對,進行實時預測和警報,並更新警報於資料庫。
5 應用場景
系統可應用在需要對大量傳感器進行長時間持續綜合分析的場合,根據不同的應用領域,進行定製開發形成特定的監測系統。
橋梁應變在線監測需要在一座橋梁部署幾十個應變傳感器,監測橋梁形變情況,提前預警斷裂。當選用應變信號傳感器作為高頻採集傳感器,則可把系統用於橋梁應變在線監測。
管道(水、天然氣、石油等)在線監測需要監測管道中的壓力、流量、流速等,綜合多採集點信號實時計算反應其洩漏情況。當選用流量、壓力信號傳感器作為高頻採集傳感器,則可把系統用於管道在線監測。
電力在線監測需要監測電力線路的電壓電流變化,計算電力網絡的功率、相位信息,用於漏電檢測和電能分配調度等。當選用電流、電壓信號傳感器作為高頻採集傳感器,則可把系統用於電力在線監測。
6 結束語
文中分析大規模傳感器高頻採集系統特點,提出基於邊緣計算的大規模傳感器高頻採集系統,對其關鍵技術和分析軟體架構進行研究,為大規模傳感器高頻採集系統應用提供基礎,推動5G垂直行業應用發展。
參考文獻
[1] 馬洪源,肖子玉,卜忠貴,趙遠.5G邊緣計算技術及應用展望[J].電信科學,2019年06期
[2] 張旭,佟曉鵬,張宇,王鵬.物聯網智能邊緣計算[J].人工智慧,2019年01期
[3] 王續澎,郭忠文,劉穎健,劉石勇,王璽.傳感器網絡高頻數據採集算法[J].中國海洋大學學報(自然科學版),2019年05期
[4] 邊緣計算在物聯網中的作用[J].無線電通信技術,2019年01期
[5] 聶衡,趙慧玲,毛聰傑.5G核心網關鍵技術研究[J].移動通信,2019年01期
[6] 朱春榮.5G網絡邊緣計算技術分析及應用展望[J].電子測試,2020年02期
[7] 高翔霄,俞達,任月慧,高玲玲,徐麗.無線傳感器網絡數據傳輸延時分配算法[J].計算機測量與控制,2020年05期
★原文發表於《廣東通信技術》2020年第9期★
DOI:10.3969/j.issn.1006-6403.2020.09.005
引用格式:藍海盛, 張文娟. 基於邊緣計算的大規模傳感器高頻採集系統研究[J]. 廣東通信技術, 2020, 40(9): 21-25.
作者簡介
藍海盛:工程師,大學本科,移動通信國家工程研究中心,主要從事無線通信領域相關技術研究。
張文娟:工程師,碩士研究生,移動通信國家工程研究中心,主要從事無線通信領域相關技術研究。
校審:聞磊、張啟迪
排版:張啟迪
來源:5G工業物聯