DolphinDB作為工業物聯網數據後臺的7大優勢

2021-01-09 DolphinDB智臾科技

DolphinDB是完全自主研發的新一代的高性能分布式時序資料庫,以一站式大數據方案、快速開發、性能優異、綜合使用成本低著稱。DolphinDB目前廣泛應用於量化金融和工業物聯網兩大場景。

數據是工業物聯網的血液。但是國內絕大部分的MES系統,以及所謂的智慧工廠,對生產過程中產生的海量的工藝數據,保存不會超過三個月,更不用說進一步對積累的數據研究利用了。數據的實時採集、計算和反控則對工業物聯網背後的數據平臺的實時計算能力提出了很高的要求。傳統的關係型資料庫,大部分開源的NoSQL,以及新一代的NewSQL離工業物聯網數據平臺的這兩個苛求要求還有較遠的距離。

時序資料庫應運而生。DolphinDB作為工業物聯網數據後臺時具有以下7大天然優勢。

1. 一站式數據解決方案

工業物聯網不僅要採集機器產生的工藝數據,還要進行實時計算和預警,並把結果展示給操作員或直接反饋給機器。同時需要將這些原始的工藝數據保存到資料庫,供在線或離線查詢。積累大量歷史數據後,又可以進行更為複雜的大數據挖掘。而這一切都可以在DolphinDB一個系統內完成。下圖展示了DolphinDB的數據處理流程。

對於系統集成商或企業來說,在一套系統上進行開發和維護,比起在多套系統上集成、開發和維護,無論是開發成本,維護成本,還是硬體的採購成本都會低得多。

2. 輕量級跨平臺部署

工業物聯網平臺通常非常複雜。既有廉價的工控機(低配的PC或嵌入式系統),也有伺服器或伺服器集群。既有邊緣計算,也有本地平臺部署和雲端平臺部署。涉及的作業系統既有Linux,也有Windows。市場上不少開源或商用的時序資料庫,以及相關的大數據生態,部件眾多複雜,體積龐大,對軟硬體的要求較高。使用一套系統進行跨平臺部署,難度很大。

DolphinDB是一個非常輕量級的系統,用GNU C++開發,系統大小僅20餘兆,無任何依賴,可以部署在上述任何平臺上。這大大節約了系統集成商的開發和維護成本。

3. 安全可控

工業物聯網平臺的數據及系統的安全可控對一個企業,乃至對國家都至關重要。DolphinDB是一個從零開始,完全自主研發的分布式時序資料庫。從底層的分布式文件系統和存儲引擎,到資料庫和核心類庫,到分布式計算引擎,到腳本語言,到各種程式語言的開發接口,甚至外圍的開發集成環境GUI、集群管理工具都是百分百自主研發的,無任何外部依賴,安全可控。

DolphinDB除了支持x86和arm的指令體系外,也在適配MIPS指令體系,以支持龍芯等國產CPU。這樣在工業物聯網平臺上,可以實現軟硬體同時自主可控。

4. 海量歷史數據存儲和處理

工業物聯網數據採集的維度高,頻率高,設備數量多,數據量特別大,且都是高時間精度數據。目前製造業使用的MES系統大部分採用關係型資料庫,往往只能保存極短時間內的工藝數據,無法保留全量高精度數據。資料庫系統的限制,導致企業無法發揮歷史數據的價值。

DolphinDB採用列式存儲,支持數據壓縮(壓縮率在20%左右),最高支持納秒精度的時間序列數據處理,單表支持百萬級別分區。可以通過增加節點的方式水平擴展DolphinDB集群的存儲能力和計算能力。DolphinDB集群支持多副本分布式存儲和分布式事務,當一個副本的數據錯誤或丟失時,啟用另一個副本恢復,保證數據的高可用和強一致。企業可以利用長年積累的歷史數據進行深度數據挖掘和數據分析,如設備的預測性維護,工藝流程的改進,產品質量的提升,製造計劃的優化等等。

簡單的說,在同樣的硬體設備上,關係型資料庫(Oracle,SQL Server)可以支持億級的時序數據,DolphinDB可以支持萬億級的時序數據。

5. 實時流計算

物聯網實時採集的數據,可以交給DolphinDB的流計算引擎清洗、實時統計、即時入庫,並通過可視化的方式實時展示。DolphinDB天然具備流表對偶性,發布一條消息相當於往流數據表中增加一條數據,可以直接使用SQL注入和查詢分析流數據,極為方便。DolphinDB的流計算引擎是基於發布-訂閱-消費的模式。通過流數據表發布數據,其他數據節點或第三方應用通過DolphinDB腳本或 API來訂閱消費流數據,把計算結果實時反饋給機器或操作員。流計算教程可以參考DolphinDB流數據教程和DolphinDB流數據聚合引擎教程。

6. 豐富的計算功能

DolphinDB的計算功能可以說是市場上的時序資料庫中最豐富的。DolphinDB內置了腳本語言,可直接在資料庫中進行複雜的計算和交互分析,避免了數據遷移。大部分計算功能和函數都經過優化,性能遠遠超過其他資料庫中的相同功能。下面列舉了DolphinDB中常用的計算功能。

6.1 範圍查詢

DolphinDB使用數據對(pair)的形式表示範圍。例如,查詢某個表某個時間範圍內的數據:

select * from table where date between beginDate:endDate

6.2 多維查詢

DolphinDB可以針對不同列進行聚合,實現高維或低維的範圍查詢功能。例如,對field1,field2 列進行過濾並分組聚合:

select sum(prc) from table where field1 in (1..100) and field2 = 『A』 group by field1, field2

6.3 抽樣查詢

DolphinDB提供了以分區為單位的抽樣查詢機制,可以按照指定的比例或者數量對分區進行抽樣,只需要在where後調用sample函數。例如,按設備ID進行範圍分區,抽取10%分區中的數據和10個分區中的數據:

//抽樣10%分區

select * from trades where sample(equipmentId, 0.1)

//抽樣10個分區

select * from trades where sample(equipmentId, 10)

6.4 精度查詢

DolphinDB的時間精度達到納秒,支持海量高精度歷史數據存儲,也支持把高精度大數據集聚合轉換成低精度小數據集存儲。同時,DolphinDB支持多種時間精度分組抽樣。例如,選擇某兩個日期之間的數據,按分鐘進行分組計算。

select avg(tint) from t1 where date(timestamp) between 2018.01.01:2018.10.11 group by minute(timestamp)

DolphinDB也支持自定義精度分組。例如,每5秒一個分組:

select avg(tint) from t1 where date(timestamp) between 2018.01.01:2018.10.11 group by bar(timestamp,5000)

6.5 插值查詢

在工業領域經常會發生採集的數據缺失。DolphinDB在查詢計算時提供了4種插值方式補全數據,向前/向後取非空值填充(bfill/ffill),線性填充(lfill)和指定值填充(nullFill)。用戶也可以通過腳本或C++插件擴充新的插值函數。

6.6 聚合查詢

DolphinDB的函數庫非常豐富,支持以下聚合函數:atImax, atImin, avg, beta, contextCount, contextSum, contextSum2, count, corr, covar, derivative, difference, first, imax, last, lastNot, max, maxPositiveStreak, mean, med, min, mode, percentile, rank, stat, std,sum, sum2,var, wavg, wsum, zscore。

6.7 面板數據分組查詢

處理面板數據時,有時候希望為每個分組的每一行數據生成一個值。DolphinDB提供了context by和滑動統計函數。

DolphinDB支持以下滑動統計函數:deltas, mavg, mbeta, mcorr, mcount, mcovar, mimax, mimin, mmax, mmed, mmin, mpercentile, mrank, mstd, msum, mvar, ratios。

例如,計算每臺設備過去10個採集點的移動平均溫度:

select equipmentId, mavg(temperature,10) as mavg_temperature context by equipmentId

DolphinDB對部分滑動統計函數進行了優化,每次計算時,充分利用上一個窗口的計算結果,最大程度地降低了重複計算。

6.8 對比查詢

DolphinDB的pivot by可用於數據透視,特別是同一時間不同列的指標對比。例如,想要對比同一時間段不同設備的平均溫度,可以使用以下代碼:

equipmentId = `A`B`B`B`C`C`A`A`A$symbol;

temperature= 49.6 29.46 29.52 30.02 174.97 175.23 50.76 50.32 51.29;

timestamp = [09:34:07,09:35:42,09:36:51,09:36:59,09:35:47,09:36:26,09:34:16,09:35:26,09:36:12];

t = table(timestamp, equipmentId, temperature)

select avg(temperature) from t pivot by timestamp.minute() as minute, equipmentId

返回的結果為:

6.9 關聯查詢

DolphinDB支持的關聯查詢種類非常多,包括等值連接、完全連接、交叉連接、左連接、asof join和窗口連接。其中asof join和窗口連接(window join)是專門為時間序列數據設計的連接方式,能夠滿足更多場景的需求。

當兩個表中的時間欄位不完全對應時,可以使用asof join,如果左表中的時間為t,它會自動選擇右表中不超過t的最近時間。窗口連接是asof join的擴展,如果窗口為w1:w2,它會在右表中選擇(t+w1)到(t+w2)之間的數據,並對這些數據使用聚合函數。例如:

select equipmentId,t1.temperature,t2.humidity from aj(t1,t2,`timestamp)

select * from wj(t1,t2,-5:0,<avg(temperature)>,`equipmentId`timestamp)

6.10 機器學習和分布式計算

DolphinDB提供了map-reduce,iterative map-reduce等分布式計算框架。用戶只需要指定數據源、map函數、reduce函數和final函數,無需編譯、部署,可以直接在線使用。為方便用戶,DolphinDB內置了常用的擬合和分類算法,可在本地數據源和分布式數據源上使用,這些算法包括線性回歸、廣義線性模型(GLM)、隨機森林(Random Forest)、邏輯回歸等。後續將會推出更多機器學習算法。

除了已有的功能外,DolphinDB提供了幾種途徑擴展系統功能。DolphinDB內置強大的類SQL和Python的腳本語言。用戶可以用腳本語言自定義函數來擴展系統功能。DolphinDB支持使用C++開發插件來擴展系統功能。除此以外,DolphinDB提供了C++、C#、Java、Python、R、JS、Excel等語言和系統的API,方便與其它系統集成。

7. 綜合使用成本低

工業企業的利潤率不高,如果數據平臺成本(軟硬體的採購成本,系統集成費用,維護費用,應用開發成本等)過高,會嚴重限制工業物聯網的發展。DolphinDB一站式的解決方案、跨平臺部署能力、強大的實時數據和海量歷史數據處理能力、豐富的計算功能及擴展能力極大的降低了系統的綜合擁有成本。

www.dolphindb.com

歡迎訪問官網下載DolphinDB

聯繫郵箱:info@dolphindb.com

相關焦點

  • 2021中國北京國際工業物聯網技術展覽會
    工業網際網路作為新一代信息技術與製造業深度融合的產物,正在深刻變革著傳統工業的創新、生產、管理和服務方式,催生出許多新技術、新模式、新業態、新產業,日益成為新工業革命的關鍵支撐和「網際網路+先進位造業」的重要基石。隨著中國工業經濟的轉型發展,工業4.0和智慧工廠理念與實踐相結合,「5G+工業網際網路」工程的雲計算、大數據、物聯網、人工智慧等解決方案,打造工業網際網路創新生態。
  • Lolita洋裝背後的工業物聯網
    作為工業4.0的支柱,工業物聯網將生產系統和管理系統相連,收集機器數據,節省人力提高效率只是其中很小一部分,人們期望它能在設計、製造、流通等各環節帶來革命性的變革,為傳統工業注入新的活力。通過工業物聯網,企業可對設備進行實時監控,在需要的時候維護,最大程度減少停產時間和規模。  在流通上,供應鏈的數位化轉型,使得消費者成為中心,供應鏈上的任何組織都可以通過對消費者數據的處理分析,優化產品分類,了解銷售情況。工業物聯網將幫助運輸公司監控車隊管理。並通過位置跟蹤,為各個車輛規劃最優路線,提高運輸效率。
  • 我們要如何重新審視工業物聯網?
    01工業物聯網處於什麼階段?工業物聯網的發展可以分為3大階段:階段1:構建數位化基礎。階段2:局部性的特定環節和特定領域的優化。階段3:整體性的智能化升級。階段1,包含了千難萬難,估計每家企業都在這個階段經歷過至暗時刻。
  • 聲勢浩大的工業物聯網正在面臨巨大的挑戰
    與共享單車、物流、家居等應用場景中,工業物聯網對設備的要求僅僅在對設備狀態進行檢測和確認。然而,在工業製造現場常常會出現灰塵、震動等情況,而應用現場對數據的採集又要求做到實時傳輸,不能夠有任何延遲。因此,在工業應用中,物聯網面臨著很大的挑戰。應用工業物聯網的工廠,所有自動化元件都必須要連接網絡以實現遠程控制,同時對觸覺、視覺、壓力、溫度等傳感數據進行全方位採集。
  • AI與工業物聯網整合將會成為未來各個垂直領域的主流系統
    自從德國率先喊出工業4.0後,相關科技也同步的突飛猛進,包括工業物聯網、大數據分析、機器人等技術發展至今,已漸漸打造出新型態的智能工廠與全新的工業化標準。 對工業物聯網來說,取得數據和分析數據是核心任務,而來自傳感器的數據點經過多個階段才能轉化為可操作的見解,工業物聯網平臺包括可擴展的數據處理流程,能夠處理需要立即關注的實時數據,以及僅在一段時間內有意義的數據,當檢測到壓力和溫度閾值的異常組合之後,物聯網平臺關閉液化石油氣灌裝機可能已經太晚了,應該在毫秒之內檢測到異常,然後依規則觸發立即反應。
  • 深圳泛為科技客戶工業物聯網項目,通過「上雲上平臺」專家組驗收
    在政策的推動下工業物聯網快速發展,讓更多的企業用上、用好、用得起,此次驗收過程中專家對泛為科技工業物聯網系統高度評價,一致通過。東莞客戶對工業物聯網的核心訴求:一、繞線機作為電機設備工廠的核心生產設備,企業主想通過手機APP實時看到工廠生產情況;二、稍大的客戶都會用到MES系統,但要從繞線機設備採集數據成本高、工作量大,作為繞線機廠商在深圳泛為科技的工業物聯網平臺開放API接口給到MES系統,這樣為MES採集數據節約大量成本
  • 工業物聯網:前世今生,萬物升騰
    在大數據云計算、新材料、資源再利用、能源存儲、機器人等多個領域領跑的日本,人口老齡化帶來的人力短缺日益凸顯。工業互聯,是日本在新工業化浪潮中保持立足之地的重要砝碼。 如何高效的開放工業設備生產數據塊的加密模組? 如何將市面上5000多種驅動協議進行統一? 如何在不影響工業生產進度的前提下進行數據採集? 如何協同軟硬體配置問題? 如何通過數據挖掘最大化利用數據? 哪些數據需要聯網?哪些數據不需要聯網?哪些數據需要公開?哪些數據不需要公開?公開到什麼程度?
  • 英特爾工業物聯網大會再推兩款新芯
    成功實現15000+邊緣計算客戶端部署,英特爾工業物聯網大會再推兩款新晶片進一步豐富產品線 毫無疑問,如今英特爾正處在行業轉折的關鍵節點。數據量的指數級增長為新商業洞察的產生和盈利服務帶來了巨大機遇。
  • 「DolphinDB智臾科技」百家號科技領域排行-哪個領域更適合新手作者?
    備註:本文數據來自站長之家移動傳媒平臺,文章涉及的數據依託平臺大數據計算所得,非百度官方數據,僅供參考。DolphinDB智臾科技是當前百家號中的普通號,目前帳號百家號權重為1,綜合排名位列926112名,科技分類排名位列45207名,領先了16.7%的百家號。
  • 蘑菇物聯獲億元B+輪融資 工業物聯網已是大勢所趨
    工業在物聯網的賦能下,也將實現從傳統製造到萬物互聯的轉變。 與此同時,中國的工業網際網路,一場如詩如畫的鴻篇巨製也正在如火如荼上演。據計世研究院統計,2020年上半年我國工業網際網路融資項目總數約50個左右,融資總額達到88億元。
  • 重慶物聯網平臺定製哪個好-河北藍蜂信息科技有限公司
    物聯網研究院研究還表明,當前工業物聯網企業的主要競爭核心集中在以智能製造裝備和智能核心設備為主的行業級終端,以及工業物聯網平臺方面。而在應對工業物聯網市場的嚴重碎片化問題上,工業物聯網平臺是一個很好的抓手。做好工業物聯網平臺建設,一方面能更好的做好設備的連接工作,另一方面能夠做好數據基礎之上的服務工作。基於工業物聯網平臺的重要性,領先製造企業、工業設備提供商、工業軟體服務商以及信息通信類企業紛紛布局工業物聯網平臺。
  • 山西空壓機物聯網平臺哪個好
    山西空壓機物聯網平臺哪個好  層是邊緣,通過大範圍、深層次的數據採集,以及異構數據的協議轉換與邊緣處理,構建工業網際網路平臺的數據基礎。一是通過各類通信手段接入不同設備、系統和產品,採集海量數據;二是依託協議轉換技術實現多源異構數據的歸一化和邊緣集成;三是利用邊緣計算設備實現底層數據的匯聚處理,並實現數據向雲端平臺的集成。無線數傳模塊。
  • 如何選擇最佳的物聯網平臺?
    ----《評價以及選擇物聯網平臺》作者O'Reilly Media 也就是說,工業物聯網平臺和消費者物聯網平臺之間有較大區別。所以,首先得明白您的應用屬於工業(如石油和天然氣,製造或資產管理)還是屬於消費者(如智能家居或可穿戴設備)。 工業物聯網平臺和消費者物聯網平臺需求不同,因而有著顯著差異。
  • 安徽物聯網系統功能價格
    安徽物聯網系統功能價格  數據模板:數據模板支持屬性與事件的定義,滿足設備的數據上報、控制、故障、告警場景。數據模板支持布爾、整數、浮點、字符串、日期、枚舉型數據類型的定義,使用數據模板的客戶可應用開發平臺的更多服務能力,包括APP開發、數據流解析、告警通知服務等,大大降低設備接入後的應用開發維護成本。
  • 三步走:國動如何制勝物聯網下一個十年?
    9月7日至10日,2019世界物聯網博覽會在無錫太湖國際會展中心舉行。在物聯網企業雲集展示的舞臺上,國動網絡通信集團(簡稱國動集團)以「國動·創造物聯新世界」為主題精彩亮相。國動集團在本次展會上以遍布全國的通信塔、通信網絡、數據中心業務為基礎,緊緊圍繞物聯網、大數據、雲計算等行業熱點需求進行了全面的展示。
  • 研華推出DeviceOn/iEdge 工業應用程式 加速實現數據整合與邊緣...
    面對物聯網海量數據、大量設備與各種系統整合往往是設備管理人員或IT人員的嚴峻挑戰,研華2020年推出DeviceOn/iEdge (Intelligent Edge Management) Industrial App,加速實踐物聯網應用上數據整合、邊緣智能管理及串接IT後臺系統。
  • 融象數科與指令集智能科技籤署戰略合作協議,聚焦智能物聯網技術的...
    根據合作協議,雙方將本著「充分信任、優勢互補、資源共享、共同發展」的原則,利用各自行業領域的領先地位,發揮技術、資源及渠道優勢,積極促進智慧城市、智慧園區等智慧物聯領域內的業務創新和合作,推進發展戰略的實施,實現共同增強企業核心競爭力的雙贏目標。浙江融象數科控股有限公司,是一家以人工智慧和大數據為核心驅動的產業數位化解決方案提供商。
  • 助力產業創新升級,百度天工物聯網亮相2020百度雲智峰會
    百度人工智慧物聯網(AIoT)正在憑藉技術優勢和創新應用助力產業升級。12月17日,「2020 ABC SUMMIT百度雲智峰會」在北京舉行。峰會展現了百度智能雲的最新成績和產業智能化成果。「雲智一體」成百度智能雲獨特的競爭力,在各行各業加快規模化落地。
  • 樂創物聯物聯網架構之硬體層執行器
    我叫樂創物聯,我主要是做工業自動化方面和物聯網方面的。了解熟悉工業自動化領域的,也開發過物聯網相關的產品。我的初衷是做工業物聯網的,但這個系統太過於龐大,後續也會自主去學習一下。所以就先做小的系統,例如構建一整套智能家居系統,從硬體到軟體全系列。下面就開始這套智能家居系統是如何在物聯網基礎上構建。在這裡你可以0開始,然後到1質變,僅僅需要一起跟我學樂創物聯物聯網架構的學習。
  • IOTE 2020 第十四屆國際物聯網展·深圳站圓滿落幕!
    7月31日,IOTE 2020第十四屆國際物聯網展·深圳站已迎來了三天盛會的最後時刻,宣告著今年的IOTE物聯網盛會在大家的共同努力下已圓滿結束!感謝所有參展商、來賓、合作媒體等對本屆展會的支持與肯定!