大數據技術當中,在海量數據的存儲環節,涉及到兩個重要的概念,就是分布式數據存儲與資料庫,穩定高效安全的數據存儲,才能為後續的計算分析環節,提供穩固的支持。今天的大數據概念解析,我們來講講分布式存儲與資料庫。
進入大數據時代,數據特徵發生了明顯的變化,數據規模大、非結構化/半結構化的數據多,使得大數據存儲本身也需要克服很多的問題。
要實現大規模數據的計算分析加工等問題,對於企業而言,需要通過各種手段來解決相關的問題,比如說通過優化存儲基礎設施,或者搭建高性能的大數據存儲框架等等。
海量數據的存儲任務,針對於不同的應用場景,往往需要因地制宜地選擇存儲方案,因此有了對象存儲、塊存儲、文件系統存儲等。
分布式文件/對象存儲系統
分布式存儲系統面向海量數據的存儲訪問與共享需求,提供基於多存儲節點的高性能,高可靠和可伸縮性的數據存儲和訪問能力,實現分布式存儲節點上多用戶的訪問共享。
目前業界比較流行的分布式存儲系統包括:HDFS、OpenStack Swift、Ceph、GlusterFS、Lustre、AFS、OSS等。
分布式關係型資料庫
關係型資料庫是建立在關係模型基礎上的資料庫,藉助於集合代數等數學概念和方法來處理資料庫中的數據。
目前業界比較流行的分布式關係型資料庫包括:DRDS、TiDB、GreenPlum、Cobar、Aurora、Mycat等。
分析型資料庫
分析資料庫是面向分析應用的資料庫,與傳統的資料庫不同,它可以對數據進行在線統計、數據在線分析、隨即查詢等發掘信息數據價值的工作。
目前業界比較流行的分析型資料庫包括:Kylin、AnalyticDB、Druid、Clickhouse、Vertica、MonetDB、InfiniDB、LucidDB等。
圖資料庫
圖資料庫的基本含義是以「圖」這種數據結構存儲和查詢數據,而不是存儲圖片的資料庫。
目前業界比較流行的圖資料庫包括:Titan、Neo4J、ArangoDB、OrientDB、MapGraph、ALLEGROGRAPH等。
列存儲資料庫
列式資料庫是以列相關存儲架構進行數據存儲的資料庫,主要適合於批量數據處理和即時查詢。
目前業界比較流行的列存儲資料庫包括:Phoenix、Cassandra、Hbase、Kudu、Hypertable等。
文檔資料庫
文檔型資料庫是NoSQL中非常重要的一個分支,它主要用來存儲、索引並管理面向文檔的數據或者類似的半結構化數據。
目前業界比較流行的文檔型資料庫包括:MongoDb、CouchDB、OrientDB、MarkLogic等。
鍵值存儲資料庫
鍵值存儲(Key-Value)是NoSQL中,數據模型中比較簡單的一個了,主要就是用哈希表,通過對於鍵(Key)的查找來找到特定的數據。
目前業界比較流行的鍵值存儲資料庫包括:Redis、Memcached、Tair等。
關於大數據概念解析,分布式存儲與資料庫,以上就為大家做了一個簡單的介紹了。大數據存儲環節,涉及到分布式與資料庫,是需要重點去掌握的一部分,對於主流的技術架構也需要有相應程度的掌握。