雲計算一周熱文回顧:五大主流資料庫模型

2020-11-23 CSDN技術社區

上一期中,我們回顧了過去一周雲計算頻道裡的熱點新聞,本期將繼續給大家回顧上周的熱點新聞。

五大主流資料庫模型

無論是關係型資料庫還是非關係型資料庫,都是某種數據模型的實現。本文將為大家簡要介紹5種常見的數據模型,讓我們來追本溯源,窺探現在流行的資料庫解決方案背後的神秘世界。

1. 關係模型

關係模型使用記錄(由元組組成)進行存儲,記錄存儲在表中,表由架構界定。表中的每個列都有名稱和類型,表中的所有記錄都要符合表的定義。SQL是專門的查詢語言,提供相應的語法查找符合條件的記錄,如表聯接(Join)。表聯接可以基於表之間的關係在多表之間查詢記錄。

2. 鍵值存儲

鍵值存儲提供了基於鍵對值的訪問方式。

鍵值對可以被創建或刪除,與鍵相關聯的值可以被更新。

鍵值存儲一般不提供事務處理機制。

3. 文檔存儲

文檔存儲支持對結構化數據的訪問,不同於關係模型的是,文檔存儲沒有強制的架構。

事實上,文檔存儲以封包鍵值對的方式進行存儲。在這種情況下,應用對要檢索的封包採取一些約定,或者利用存儲引擎的能力將不同的文檔劃分成不同的集合,以管理數據。

4. 列式存儲

如果翻轉數據,列式存儲與關係存儲將會非常相似。與關係模型存儲記錄不同,列式存儲以流的方式在列中存儲所有的數據。對於任何記錄,索引都可以快速地獲取列上的數據。

5. 圖形資料庫

圖形資料庫存儲頂點和邊的信息,有的支持添加注釋。

五個值得關注的圖形資料庫

圖形資料庫是一種非關係型資料庫,它應用圖形理論存儲實體之間的關係信息。最常見的一個例子,就是社會網絡中人與人之間的關係。關係型資料庫用於存儲「關係型」數據的效果並不好,其查詢複雜、緩慢、超出預期,而圖形資料庫的獨特設計恰恰彌補了這個缺陷。

Google的圖形計算系統名為Pregel,下面讓我們來為您介紹幾個流行的圖形資料庫。

1. Neo4j

Neo4j是一個流行的圖形資料庫,它是開源的。

2. FlockDB

FlockDB是Twitter為進行關係數據分析而構建的。FlockDB迄今為止還沒有穩定的版本,對於它是否是一個真正的圖形資料庫,尚有爭議。

3. AllegroGraph

AllegroGraph是一個基於W3c標準的為資源描述框架構建的圖形資料庫。它為處理連結數據和Web語義而設計,支持SPARQL、RDFS++和Prolog。

4. GraphDB

GraphDB是德國sones公司在.NET基礎上構建的。GraphDB託管在Windows Azure平臺上。

5. InfiniteGraph

InfiniteGraph基於Java實現,它的目標是構建「分布式的圖形資料庫」,已被美國國防部和美國中央情報局所採用。

下一代Hadoop戰略——數據即平臺

在上周的Strata大會上,與會者透露出有關下代Hadoop的消息。包括對6000節點的支持、配備高可用性的HDFS以及下一代MapReduce的特性等。而未來Hadoop替代作業系統的大膽想法也讓我們充滿無限遐想。

在Strata會議上Hortonworks創始人和Apache Hadoop項目VP Arun Murthy透露新版Hadoop的相關特性。下一代的Hadoop將支持6000節點,同時配備高可用性的HDFS(Hadoop Distributed File System)。

而下一代MapReduce框架則被命名為YARN或MRv2(MapReduce version 2)。新框架已經不再是傳統的MapReduce框架,甚至與MapReduce無關,YARN可被看做是通用的運行時框架,用戶可以編寫自己的計算框架,在該運行環境中運行。經過改良的MapReduce將分離HDFS中塊和命名空間的管理,提高數據的可伸縮性。最重要的是改良後的MapReduce將對非MapReduce應用進行支持,這使得更多類型應用將具備在MapReduce工作的能力。

谷歌算法揭秘:一次搜索請求平均往返2400公裡

谷歌搜索演進

作為全球使用最廣泛的搜尋引擎,谷歌算法一直有一層神秘面紗。近日谷歌工程總監斯科特·霍夫曼向騰訊科技講述谷歌算法幕後故事,稱2011年有520多項改進,自2003年到現在,Google搜索已解決4500億個搜索請求。

斯科特還透露,谷歌一個搜索請求平均往返於電腦和數據中心單程距離是750英裡,這也意味著一次搜索請求平均往返需要1500英裡,約合2400公裡。

RavenDB:基於Windows/.NET平臺的NoSQL資料庫

眾所周知,NoSQL運動旨在成為大數據時代傳統關係資料庫管理系統的替代品。如今Microsoft對開源的態度有所轉變,RavenDB就是很好的例子。Microsoft對RavenDB(NoSQL資料庫)的認可令很多人感到驚訝。RavenDB可以輕易的替代關係資料庫管理系統併兼容以往的.NET應用。

RavenDB是針對Windows/.NET平臺而設計的文檔資料庫。RavenDB的出現將.NET應用與非關係資料庫連接到一起。數據以Shcema-less方式存儲,並直接通過HTTP、RESTful API或更方便的.NET客戶端API連接。.NET客戶端API使用LINQ操作RavenDB資料庫文檔存儲。

雲計算:亞馬遜第一 第二把交椅何人坐?

亞馬遜對用戶推出的Web服務,使它成為迄今為止最大的雲服務提供商。就像大多數的大型雲供應商一樣,亞馬遜並沒有就當前或計劃中的數據中心透露太多。

埃森哲分析師Huan Liu的最新研究結果顯示,亞馬遜的Elastic Compute Cloud(EC2)在高達45萬臺伺服器上運行。亞馬遜沒有公布AWS的營收,但有人表示它可能已經是一項10億美元的業務。

本文預計Rackspace、Google、微軟、IBM、惠普、VMware、Facebook這七家公司將成為亞馬遜的雲對手。

新密鑰技術簡化雲端數據加密

由於在雲環境中,IT團隊缺乏對數據安全的直接控制,所以數據遷移到雲環境將會給IT團隊帶來新的複雜的安全問題。此外,雲供應商認為數據安全是需要共同承擔責任,即服務供應商保證物理安全,用戶必須保護其伺服器和數據的安全。這將需要新的加密策略和密鑰管理策略,將密鑰存儲在雲環境外部,而不是雲環境中。

初創安全公司Porticor剛剛推出了一個解決方案,專門解決雲環境中靜態數據安全問題。Porticor公司提供了一種分離密鑰加密解決方案,雲客戶是唯一知道主密鑰的人。另外,Porticor公司解決了所有與加密數據有關的複雜問題,客戶幾乎不要去想這些問題。這種獨特的密鑰管理解決方案既提供了安全性,也提供了便利性。

微軟下調Azure雲服務價格 與亞馬遜競爭

微軟上周下調了其Azure雲存儲服務和Windows Azure Extra Small計算服務的價格。此舉是微軟在亞馬遜下調其Web服務價格幾天之後採取的行動。

這一切意味著什麼?對於IT買主來說,雲計算價格正在迅速下降並且已經與電費水平一樣。考慮到電費受天然氣價格、季節和其它可變因素的影響,雲計算的價格可能更便宜。

相關焦點

  • [資訊]一周熱文回顧:Bing更新165TB高清地圖
    在2012年蘋果開發者大會上,蘋果也宣布將推出自己的3D地圖,用於取代谷歌地圖,在谷歌、蘋果、微軟三國爭霸的今天,微軟似乎沒跟上步調,不過這周傳來消息,微軟推出歷史上最大的地圖升級,Bing地圖更新165TB高清影像數據,重回民眾視野……好了,不多說了,下面繼續給大家介紹和回顧這一周以來CSDN資訊頻道的熱點新聞。1.
  • 雲計算簡史(完整版)
    (3) NoSQL資料庫與大數據技術同步發展的還包括NoSQL(非關係型)資料庫市場。在上個世紀,大多數商業資料庫都是關係資料庫,通過SQL語言進行數據處理和查詢。當大數據技術發展起來後,技術專家們發現資料庫完全可以用不同的形態來存儲數據,這樣可以大幅減少數據分析過程中的預處理工作量。所以,從2009前後開始,各種NoSQL資料庫開始進入市場。
  • 剖析雲計算平臺中的「共享性資料庫」,按需收費才是雲平臺的未來
    編者按:本文來自劉維投稿(微博@劉維生活路),從事雲計算行業多年,從個人的經驗,及與一些Google、京東等公司雲計算架構師交流得到的心得的總結,為大家分析下什麼是沒錯,共享型資料庫是對比獨享性資料庫的一種針對用戶資源所有權的資料庫稱謂, 它是伴隨著雲計算出來之後的一種資料庫創新,以節約資源為目的,而一般情況下,自己的伺服器或機上安裝的不與人共享的數據稱為「獨享性資料庫」。很多人不明白共享性資料庫的特點,那麼我接下來就簡單介紹一下。
  • DTCC 2020 | 阿里雲葉正盛:資料庫2025
    之前從事軟體研發工作十餘年,2010年開始加入阿里做「去IOE」、異地多活和雲計算方面的工作,2020年帶領團隊衝進了Gartner全球資料庫領導者象限。資料庫發展歷程在介紹資料庫2025的規劃之前,首先回顧一下資料庫的發展歷程。資料庫的發展離不開計算機基礎設施的發展,因此可以將資料庫的發展分為五個階段。
  • 理解資料庫與數據模型的概念
    為了減少數據冗餘,提高數據的共享性和獨立性,人們對需要對使用的數據進行統一規劃管理,形成一個數據中心,構成一個資料庫。資料庫中數據能夠滿足所有用戶的不同要求,供不同用戶共享。這個階段稱為資料庫管理系統階段。4、數據模型數據模型是資料庫的基礎,數據是對客觀事物的符號表示,模型是現實世界的抽象。數據模型是對數據特徵的抽象。
  • 雲計算快速入門指南
    雲計算可以分為三個雲服務模型:基礎設施即服務(IaaS)、平臺即服務(PaaS)、軟體即服務(SaaS)。像一些應用程式僅在特定時間(例如一年中的某一周)高峰使用,在其他很多時間都閒著,這種情況不需要專門進行硬體和軟體鋪設,直接將其託管在雲中能節省很多成本。雲計算的缺點雲計算不一定比其他形式的計算更便宜,因為從長遠來看,租金不一定比購買划算。如果應用程式對計算服務有著長期穩定的需求,在內部提供該服務可能更經濟。
  • 雲計算再思考:亞馬遜 re:Invent帶來哪些啟示?
    雲計算疊加效應日益突出 亞馬遜re:Invent大會的新產品和新服務一直都是整個雲計算產業發展的風向標。與往年類似,在這屆re:Invent大會上,AWS 發布了多項全新的服務和功能,主要集中在計算、存儲、資料庫、數據分析、容器、機器學習運維、工業機器學習等多個方面,幾乎涉及到雲計算從IaaS到PaaS的各個領域。並且,AWS各項雲計算服務之間的疊加效應日益突出。
  • 五大化學晶體學資料庫介紹
    So,本期的乾貨就是:對晶體學資料庫來個大盤點吧!五大晶體學資料庫1.自1965年起就從事晶體數據的收集、整理與計算機化工作,該中心發展的劍橋結構資料庫系統CSDS (The Cambridge Structural Database System,簡寫為CSDS)是基於X光和中子衍射實驗唯一的小分子及金屬有機分子晶體的結構資料庫。
  • 雲計算開發與人工智慧的關係,雲計算開發主宰物聯網
    目前79%的物聯網開發者花費至少25%的時間在分析和資料庫上,而花費42%在大數據或者是項目分析上。55%的物聯網開發者主要通過雲連接設備,32%會選擇使用集線器或中間層來連接。26%的開發者最常將雲計算與物聯網聯繫在一起,並且有三倍的可能性更常使用雲環境作為開發環境。
  • 終結硬碟時代 主流內存資料庫對比報告
    除此之外,McObject、ALTIBASE等商業資料庫,以及Berkeley DB、Redis等開源資料庫一直專注於內存資料庫市場。本文將針對內存資料庫展開,希望對企業選擇內存資料庫有所幫助。SQL Server  微軟SQL Server資料庫伺服器提供了資料庫的從伺服器到終端的完整的解決方案,其中資料庫伺服器部分,是一個資料庫管理系統,用於建立、使用和維護資料庫。
  • 發布多款新品重新定義雲計算,亞馬遜AWS如何引領行業?
    作為雲計算領頭羊的亞馬遜雲服務(AWS)一向低調,但其行業地位令其很難不被放在放大鏡下仔細審視。其中,在每年12月舉辦的旗艦技術會議re:Invent大會,就是觀察這家雲巨頭公司的重要窗口。可以說,re:Invent直接決定了AWS雲技術未來發力方向,體現了雲計算技術產品洞察、商業實踐和主流走勢。
  • 2020年雲計算標準和應用大會,ZStack榮獲雲計算標準化優秀成員單位...
    2020年12月29-30日,第十屆中國雲計算標準和應用大會,在北京成功舉辦。本次大會由中國電子技術標準化研究院(簡稱電子標準院)主辦,由全國信標委雲計算標準工作組、中國開源雲聯盟、木蘭開源社區、雲計算標準與應用工業和信息化部重點實驗室聯合承辦。
  • 2020年雲計算標準和應用大會,ZStack榮獲「雲計算標準化優秀成員...
    本次大會由中國電子技術標準化研究院(簡稱電子標準院)主辦,由全國信標委雲計算標準工作組、中國開源雲聯盟、木蘭開源社區、雲計算標準與應用工業和信息化部重點實驗室聯合承辦。基於強勁的技術與產品實力及行業內外的廣泛好評,ZStack多次積極地參與了國家級的雲計算行業標準制定和推廣,極大的促進了我國雲計算行業快速走上規範化、健康化的發展道路。ZStack榮獲「雲計算標準化優秀成員單位」獎項可謂名副其實。
  • 雲計算有哪些類型_雲計算的三大核心技術
    雲計算也在快速發展,一直服務於網際網路的各個企業,隨著雲計算的快速發展,雲計算已經有好幾種類型了,分別是公有雲、私有雲和混合雲,其中每一種都有自己的優勢,相信隨著技術的不斷發展,雲計算可能還有更多類型,下面小編來談談每種計算的優勢是什麼。
  • Gartner發資料庫魔力象限:雲廠商挑戰大玩家,阿里雲成為黑馬
    全球權威的IT諮詢公司Gartner於上周發布了2018年資料庫系統的魔力象限。在這份具有風向標意義的資料庫行業評估報告中,展示了兩大變化:第一,雲計算廠商集體上榜,挑戰甲骨文等傳統資料庫廠商地位;阿里雲首次入榜即成為黑馬,進入 「遠見者」象限。
  • 國產資料庫邁上全棧服務新高度
    專家表示,隨著雲計算、大數據和  中國信息通信研究院雲計算與大數據研究所所長何寶宏表示,隨著大數據、雲計算、區塊鏈等新一代,引領著資料庫產業的發展潮流。其中,國產資料庫產業正在迎來跨越式發展新機遇,加快科技自立是一條切實可行的途徑。  「當然,也要承認我們與國外頂尖的資料庫廠商還有差距。」
  • 雲計算是大趨勢,私有雲,更有動力,更有競爭,更有想像力
    中國信通院主辦的雲計算開源大會上,公布了包含金融、交通、工業、能源、服務五大行業「十佳上雲」優秀案例。這些私有雲服務案例也展示了中國大型政企在選擇雲部署方案時的傾向性:1. 光大證券私有雲平臺——EasyStack光大證券攜手ECS 易捷行雲企業雲構建了高效、安全、穩定、可靠的雲基礎設施,於2018 年6 月正式上線。
  • 中國雲計算行業現狀調研分析及市場前景預測報告(2020年版)
    《中國雲計算行業現狀調研分析及市場前景預測報告(2020年版)》在多年雲計算行業研究的基礎上,結合中國雲計算行業市場的發展現狀,通過資深研究團隊對雲計算市場資訊進行整理分析,並依託國家權威數據資源和長期市場監測的資料庫,對雲計算行業進行了全面、細緻的調研分析。
  • 蛋白組學/代謝組學如何快速從主流資料庫中獲取人/小鼠數據?
    我們就從物種的DNA或蛋白質序列說起,在我們的科學研究中下載序列是一件簡單不過的事情,無非就是聯網NCBI等主頁上,選擇資料庫後輸入AC號或GI號後直接下載。是否可以直接下載資料庫準備好的序列文件?或者編寫程序腳本進行批量下載? 本次小鹿分享的是2種熱門物種(人和鼠)的無編程基礎的下載方式。
  • 蛋白組學/代謝組學如何快速從主流資料庫中獲取人/小鼠數據?
    是否可以直接下載資料庫準備好的序列文件?或者編寫程序腳本進行批量下載?本次小鹿分享的是2種熱門物種(人和鼠)的無編程基礎的下載方式。(1)用瀏覽器登錄NCBI資料庫官網:https://www.ncbi.nlm.nih.gov/(2)資料庫選擇框:選擇Gene;在搜索框輸入:MYH9,可以添加Homo sapiens或者Human,這樣匹配更準確;(3)點擊MYH9 - myosin heavy chain 9,選擇FASTA格式;