「圖型計算架構」GraphTech生態系統2019-第1部分:圖型資料庫

2020-11-26 騰訊網

這篇文章是關於GraphTech生態系統的3篇文章的一部分,截至2019年。這是第一部分。它涵蓋了圖形資料庫環境。第三部分是圖形可視化工具。

The graph database landscape in 2019

動態生態系統

圖形存儲系統的吸引力比以往任何時候都強勁,自2013年以來,人們對圖形存儲系統的興趣穩步增長。

一個動態的生態系統

圖形存儲系統的吸引力比以往任何時候都更強,自2013年以來,人們對圖形存儲系統的興趣穩步增長。

DBMS popularity trend by database model between 2013 and 2019 — Source: DB-Engine

圖形資料庫的市場份額不斷增加,市場上的產品數量也在增加,供應商數量是5年前的7倍。新的市場研究和越來越大的財務預測每學期出版。有人說,圖表資料庫市場在2017年為3900萬美元,其他為6.6億美元,預測範圍從2024年的4.45億美元到2023年的24億美元。

雖然很難就確切的數字達成一致,但所有報告都指出了相同的增長動力:

需要速度和改進的性能以減少發現新數據相關性的成本和時間

當前實時處理多維數據技術的局限性

基於圖形的人工智慧與機器學習工具與服務的開發

在金融犯罪、欺詐和安全等特定領域:更快速地解決現有風險和利用相關數據的迫切需要。

總而言之,我們有越來越多的應用程式依賴於連接的數據來產生洞察力,以及處理不斷增長的數據量和複雜性的緊迫技術問題,這些都推動了圖形市場的發展。

很難追蹤。在這篇文章中,我建議至少儘可能地展示當前的市場。我將圖形生態系統劃分為三個主要層,儘管現實更複雜,而且這些層通常是可滲透的。

The GraphTech ecosystem layers

圖形資料庫布局

GraphTech的第一層在生態系統增長中起著關鍵作用。圖形資料庫管理系統(GDBMS)正在驅動生態系統。他們是它的主要演員。這些系統幫助組織解決存儲複雜的連接數據和從非常大的數據集中提取見解的技術挑戰。

塑造市場

自20世紀60年代以來,網絡模型已經出現在資料庫領域,但圖結構的使用仍然局限於學術界。性能和模型還不是最佳的,我們不得不等到21世紀初和引入ACID圖形資料庫後才能看到更大規模的採用。從那時起,圖形資料庫開始作為一種合法的業務解決方案出現,以解決關係系統的一些缺點。

專門為存儲類似圖形的數據而構建的本機系統和具有不同主數據模型(例如關係資料庫或其他NoSQL資料庫)的非本機系統構成了市場。在這兩個方面,我們發現商業和開源系統以及屬性圖和RDF三元組存儲是存儲圖形數據的兩個主要模型。

Type of storage for graph-like data

原生系統

在主要的原生系統中,Neo4j是市場領導者,這些系統的模型都經過了完全優化,可以處理類似圖形的數據。NativeGraph資料庫的第一個版本於2010年發布,提出了一個雙重商業和開源版本,供開發人員試驗圖形。此後,該公司獲得了大量客戶,募集資金超過1.5億美元。

在開源社區,JanusGraph接管了Titan項目,其母公司於2015年被DataStax收購。JanusGraph項目現在提出了一個分布式的、開源的圖形資料庫,這個資料庫最近受到了廣泛的關注。DGraph是另一個用Go編寫的開源項目,在2017年發布了一個可供生產的版本,同時籌集了300萬美元的種子資金。

其他的解決方案包括Stardog、RDF的知識圖三重存儲,或者最近發布的TigerGraph(以前稱為GraphSQL)。商業系統InfiniteGraph和Sparksee已經出現了一段時間。其他開源系統,如HypergraphDB,提出了基於有向超圖的資料庫。

多模型資料庫和混合系統

隨著NoSQL模型的成功,多模型資料庫應運而生,以解決筒倉系統的倍增所帶來的複雜性。這些資料庫旨在支持各種數據類型,在一個單獨的數據存儲中處理各種模型,如文檔、鍵值、RDF和圖形。如果您需要處理多種數據類型,但又希望避免管理各種筒倉的操作複雜性,則它們特別方便。

在包含graph作為支持模型的原生多模型資料庫中,我們可以將ArangoDB命名為ArangoDB。這個開源的多模型資料庫於2011年發布,支持三種數據模型:key/value、documents和graph。cosmosdb是微軟Azure在多模型領域的最新產品。該分布式雲資料庫於2017年推出,支持四種數據類型:鍵值、文檔、列族和圖形。datatax Enterprise也是一個分布式雲資料庫,構建在開源nosql apache cassandra系統之上。自2016年新增數據稅企業圖以來,系統支持列族、單據、鍵值、圖形。最後,MarkLogic是一個歷史上的涉眾,他在2013年為其現有的受支持文檔模型添加了rdf triples支持。

另一個強烈的市場吸引力信號是資料庫主要參與者策略的演變。在過去的幾年中,我們看到傳統的關係存儲重量級者通過專用的api將圖形功能添加到他們的系統中。2012年,IBM在其資料庫中添加了NoSQL圖形存儲DB2-RDF。一年後,甲骨文將它的資料庫圖形選項更名為oraclespatial和graph,今天稱為Oracle大數據空間和圖形。最近在2016年,SAP Hana宣布發布SAP Hana Graph,通過對圖形的支持擴展了其關係型DBMS的功能。

在下面的演示中,我列出並展示了大多數用於圖形數據的存儲系統。

本文:http://jiagoushi.pro/node/1092

討論:請加入知識星球【首席架構師圈】或者小號【jiagoushi_pro】

視頻號有精彩分享,不容錯過。謝謝大家關注,轉發,點讚和在看。

相關焦點

  • 百度安全開源大規模圖資料庫HugeGraph
    1.GraphDB圖資料庫隨著社交網絡、移動網際網路和IOT等新的網際網路應用不斷湧現,用戶、系統和傳感器產生的數據呈指數級增長,數據內部依賴和複雜度增加。2.1 HugeGraph的特點HugeGraph是一款面向分析型,支持批量操作的圖資料庫系統,它能夠與大數據平臺無縫集成,有效解決海量圖數據的存儲、查詢和關聯分析需求。HugeGraph支持HBase和Cassandra等常見的分布式系統作為其存儲引擎來實現水平擴展。
  • 初識分布式圖資料庫 Nebula Graph 2.0 Query Engine
    一、概述分布式圖資料庫 Nebula Graph 2.0 版本相比 1.0 有較大改動,最明顯的變化便是,在 1.0 版本中 Query、Storage 和 Meta 模塊代碼不作區分放在同一個代碼倉中,而 Nebula Graph 2.0 開始在架構上先解耦成三個代碼倉:nebula-graph、nebula-common 和 nebula-storage,其中 nebula-common
  • 輕鬆搞定TB級數據,開源GraphLab突破人類圖計算「極限值」
    圖數據處理過去一直是數據科學家的專利,隨著數據應用得越來越廣泛,圖數據分析成為數據分析領域必不可少的部分,人們越來越需要易於上手、使用簡單的圖數據分析工具。GraphLab是個很受大家歡迎的開源項目,GraphLab開發者們不斷追求圖計算的創新和發展,使其能迎合海量數據處理的要求。
  • 微軟發分布式圖處理引擎GraphEngine1.0
    【IT168 資訊】5月21日消息,由微軟亞洲研究院開發的Graph Engine 1.0預覽版正式發布。Graph Engine是一個基於內存的分布式大規模圖數據處理引擎。在此之前,它在學術界更廣為人之的名稱是Trinity。  大規模圖處理在很多領域扮演著重要的角色。
  • TechTarget中國發布最新資料庫工程師薪酬調查報告
    專注於企業IT領域的網絡媒體TechTarget中國於近日發布了「2009年資料庫工程師薪酬調查報告」。本次調查活動由TechTarget資料庫網站發起,歷時一個月時間,針對中國從事資料庫行業的技術人員進行了關於薪酬、福利以及職業規劃等方面的調查,並得到了用戶積極的響應。
  • 智能生態系統的產業架構與趨勢研究
    1.信息生態系統的構成 信息生態系統指的是信息活動中各種要素的總稱。 2.信息生態系統的製造鏈與服務鏈的對應關係 根據上面的分析,信息生態系統包含信息製造鏈和信息服務鏈,信息製造鏈自下而上分為感知層、網絡層、平臺層和應用層,而信息服務鏈自下而上分為信息消費、信息傳輸、信息處理和信息挖掘,分別實現信息採集與利用、信息交互與傳輸、信息存儲與計算、信息挖掘與再生等功能(見圖表1.2)。
  • DTCC2020阿里雲李飛飛:雲原生分布式資料庫與數據倉庫系統點亮數據...
    因為單個節點計算存儲能力都特別強,200TB的數據按照傳統的分布式架構,假設1個節點只能處理1TB,那就需要200個分布式節點。雲原生架構1個節點可以處理100TB,也就是為2000TB的數據,傳統分布式架構需要200個節點,將雲原生架構結合起來需要兩三個節點,分布式事務處理、分布式查詢的概率會大大降低,整個系統的效率會大大提升。
  • 數易軒:圖資料庫的定義是什麼?圖資料庫如何設計
    在計算機科學中,圖資料庫(英語:graph database,GDB)是一個使用圖結構進行語義查詢的資料庫,它使用節點、邊和屬性來表示和存儲數據。該系統的關鍵概念是圖,它直接將存儲中的數據項,與數據節點和節點間表示關係的邊的集合相關聯。這些關係允許直接將存儲區中的數據連結在一起,並且在許多情況下,可以通過一個操作進行檢索。圖資料庫將數據之間的關係作為優先級。
  • 晶片行業深度報告:為什麼說ARM可能是國產計算架構的最優選擇
    因此,已經獲得 ARM V8 永 久授權的海思、飛騰等廠家憑藉自身的研發能力,有可能發展出一套自己 的指令集架構。第三類,是以海光、兆芯為代表的獲得 x86 授權的國產 CPU,英特爾、AMD 的 X86 授權通常在內核層,則一方面獲得授權後的 晶片仍有相對「黑盒子」的部分,其次在此基礎上擴展形成自主指令集的 難度也較大。
  • 圖論Graph theory
    在計算機科學中,圖被用來表示通信網絡、數據組織、計算設備、計算流程等。例如,一個網站的連結結構可以用一個有向圖表示,其中頂點表示網頁,有向邊表示從一個頁面到另一個頁面的連結。類似的方法可以應用到社交媒體、旅遊、生物、計算機晶片設計和許多其他領域。因此,開發處理圖形的算法是計算機科學的主要興趣所在。圖的變換通常是形式化的,並由圖形重寫系統表示。
  • 騰訊分析系統架構解析
    TA(Tencent Analytics,騰訊分析)是一款面向第三方站長的免費網站分析系統,在數據穩定性、及時性方面廣受站長好評,其秒級的實時數據更新頻率也獲得業界的認可。本文將從實時數據處理、數據存儲等多個方面帶你深入探尋TA的系統架構及實現原理。
  • Pick of the Week'20 | 第 36 周看點--DB-Engine 圖資料庫 9 月榜單發榜
    本周分享的主題由社區用戶 @cixiaobizhang 提出,關於#uuid 函數報錯#和#nebula 伺服器部署##uuid 函數報錯#在插入節點時調用系統自帶的 uuid 函數出現  execute error: Get UUID Failed  錯誤
  • 清華首次提出「類腦計算完備性」及計算系統層次結構,登上Nature
    類腦計算與傳統計算機架構不同,後者是圍繞圖靈完備和完善的馮諾依曼結構,前者目前還沒有沒有廣義的系統層次結構,或對類腦性計算的完整性的理解。這會影響類腦計算軟體和硬體之間的兼容性,從而阻礙了大類腦式計算的開發效率。
  • [公開課]《Python:從計算到算計》第04講: 科學計算(Scipy)
    0, 1],[0, 0, 0, 0, 0]]graph = csr_matrix(graph)print(graph)n_components, labels = connected_components(csgraph=graph, directed=False, return_labels=True)n_componentslabels
  • 分布式架構概述
    2.1 IBM大型機曾支撐美國航天登月計劃2.2 IBM主機一直服務於金融等核心行業的關鍵領域由於高可靠性和超強的計算能力,幾遍在X86和雲計算飛速發展的情況下,IBM的大型機依然牢牢佔據著一定的高端市場份額
  • 清華首提「類腦計算完備性」及計算系統層次結構,登Nature
    神經形態計算從生物大腦中獲取靈感,為計算機技術和體系結構的下一波發展提供了方向。類腦計算與傳統計算機架構不同,後者是圍繞圖靈完備和完善的馮諾依曼結構,前者目前還沒有沒有廣義的系統層次結構,或對類腦性計算的完整性的理解。
  • 入選Gartner 魔力象限,剖析華為雲 GaussDB 資料庫演進之路
    日前,國際知名調研機構Gartner發布了2020年全球雲資料庫魔力象限報告(《Magic Quadrant for Cloud Database Management Systems》),華為雲資料庫憑藉GaussDB系列資料庫產品入選魔力象限。而取得這樣的成果,距離華為2019年5月正式宣布GaussDB資料庫系列產品商用推出,其實僅僅1年半左右。
  • 基於物聯網架構的箱式變電站智能監測系統
    國網上海市電力公司青浦供電公司、上海尤比酷電氣有限公司的研究人員沈曉峰、徐愛蓉、曹基南、張衛紅、胡大良,在2020年第9期《電氣技術》雜誌上撰文,針對10kV箱式變電站運檢管理需求,基於物聯網架構設計並研發了一套箱式變電站智能監測系統。