上一期中,我們回顧了過去一周雲計算頻道裡的熱點新聞,本期將繼續給大家回顧上周的熱點新聞。
五大主流資料庫模型
無論是關係型資料庫還是非關係型資料庫,都是某種數據模型的實現。本文將為大家簡要介紹5種常見的數據模型,讓我們來追本溯源,窺探現在流行的資料庫解決方案背後的神秘世界。
1. 關係模型
關係模型使用記錄(由元組組成)進行存儲,記錄存儲在表中,表由架構界定。表中的每個列都有名稱和類型,表中的所有記錄都要符合表的定義。SQL是專門的查詢語言,提供相應的語法查找符合條件的記錄,如表聯接(Join)。表聯接可以基於表之間的關係在多表之間查詢記錄。
2. 鍵值存儲
鍵值存儲提供了基於鍵對值的訪問方式。
鍵值對可以被創建或刪除,與鍵相關聯的值可以被更新。
鍵值存儲一般不提供事務處理機制。
3. 文檔存儲
文檔存儲支持對結構化數據的訪問,不同於關係模型的是,文檔存儲沒有強制的架構。
事實上,文檔存儲以封包鍵值對的方式進行存儲。在這種情況下,應用對要檢索的封包採取一些約定,或者利用存儲引擎的能力將不同的文檔劃分成不同的集合,以管理數據。
4. 列式存儲
如果翻轉數據,列式存儲與關係存儲將會非常相似。與關係模型存儲記錄不同,列式存儲以流的方式在列中存儲所有的數據。對於任何記錄,索引都可以快速地獲取列上的數據。
5. 圖形資料庫
圖形資料庫存儲頂點和邊的信息,有的支持添加注釋。
五個值得關注的圖形資料庫
圖形資料庫是一種非關係型資料庫,它應用圖形理論存儲實體之間的關係信息。最常見的一個例子,就是社會網絡中人與人之間的關係。關係型資料庫用於存儲「關係型」數據的效果並不好,其查詢複雜、緩慢、超出預期,而圖形資料庫的獨特設計恰恰彌補了這個缺陷。
Google的圖形計算系統名為Pregel,下面讓我們來為您介紹幾個流行的圖形資料庫。
1. Neo4j
Neo4j是一個流行的圖形資料庫,它是開源的。
2. FlockDB
FlockDB是Twitter為進行關係數據分析而構建的。FlockDB迄今為止還沒有穩定的版本,對於它是否是一個真正的圖形資料庫,尚有爭議。
3. AllegroGraph
AllegroGraph是一個基於W3c標準的為資源描述框架構建的圖形資料庫。它為處理連結數據和Web語義而設計,支持SPARQL、RDFS++和Prolog。
4. GraphDB
GraphDB是德國sones公司在.NET基礎上構建的。GraphDB託管在Windows Azure平臺上。
5. InfiniteGraph
InfiniteGraph基於Java實現,它的目標是構建「分布式的圖形資料庫」,已被美國國防部和美國中央情報局所採用。
下一代Hadoop戰略——數據即平臺
在上周的Strata大會上,與會者透露出有關下代Hadoop的消息。包括對6000節點的支持、配備高可用性的HDFS以及下一代MapReduce的特性等。而未來Hadoop替代作業系統的大膽想法也讓我們充滿無限遐想。
在Strata會議上Hortonworks創始人和Apache Hadoop項目VP Arun Murthy透露新版Hadoop的相關特性。下一代的Hadoop將支持6000節點,同時配備高可用性的HDFS(Hadoop Distributed File System)。
而下一代MapReduce框架則被命名為YARN或MRv2(MapReduce version 2)。新框架已經不再是傳統的MapReduce框架,甚至與MapReduce無關,YARN可被看做是通用的運行時框架,用戶可以編寫自己的計算框架,在該運行環境中運行。經過改良的MapReduce將分離HDFS中塊和命名空間的管理,提高數據的可伸縮性。最重要的是改良後的MapReduce將對非MapReduce應用進行支持,這使得更多類型應用將具備在MapReduce工作的能力。
谷歌算法揭秘:一次搜索請求平均往返2400公裡
谷歌搜索演進
作為全球使用最廣泛的搜尋引擎,谷歌算法一直有一層神秘面紗。近日谷歌工程總監斯科特·霍夫曼向騰訊科技講述谷歌算法幕後故事,稱2011年有520多項改進,自2003年到現在,Google搜索已解決4500億個搜索請求。
斯科特還透露,谷歌一個搜索請求平均往返於電腦和數據中心單程距離是750英裡,這也意味著一次搜索請求平均往返需要1500英裡,約合2400公裡。
RavenDB:基於Windows/.NET平臺的NoSQL資料庫
眾所周知,NoSQL運動旨在成為大數據時代傳統關係資料庫管理系統的替代品。如今Microsoft對開源的態度有所轉變,RavenDB就是很好的例子。Microsoft對RavenDB(NoSQL資料庫)的認可令很多人感到驚訝。RavenDB可以輕易的替代關係資料庫管理系統併兼容以往的.NET應用。
RavenDB是針對Windows/.NET平臺而設計的文檔資料庫。RavenDB的出現將.NET應用與非關係資料庫連接到一起。數據以Shcema-less方式存儲,並直接通過HTTP、RESTful API或更方便的.NET客戶端API連接。.NET客戶端API使用LINQ操作RavenDB資料庫文檔存儲。
雲計算:亞馬遜第一 第二把交椅何人坐?
亞馬遜對用戶推出的Web服務,使它成為迄今為止最大的雲服務提供商。就像大多數的大型雲供應商一樣,亞馬遜並沒有就當前或計劃中的數據中心透露太多。
埃森哲分析師Huan Liu的最新研究結果顯示,亞馬遜的Elastic Compute Cloud(EC2)在高達45萬臺伺服器上運行。亞馬遜沒有公布AWS的營收,但有人表示它可能已經是一項10億美元的業務。
本文預計Rackspace、Google、微軟、IBM、惠普、VMware、Facebook這七家公司將成為亞馬遜的雲對手。
新密鑰技術簡化雲端數據加密
由於在雲環境中,IT團隊缺乏對數據安全的直接控制,所以數據遷移到雲環境將會給IT團隊帶來新的複雜的安全問題。此外,雲供應商認為數據安全是需要共同承擔責任,即服務供應商保證物理安全,用戶必須保護其伺服器和數據的安全。這將需要新的加密策略和密鑰管理策略,將密鑰存儲在雲環境外部,而不是雲環境中。
初創安全公司Porticor剛剛推出了一個解決方案,專門解決雲環境中靜態數據安全問題。Porticor公司提供了一種分離密鑰加密解決方案,雲客戶是唯一知道主密鑰的人。另外,Porticor公司解決了所有與加密數據有關的複雜問題,客戶幾乎不要去想這些問題。這種獨特的密鑰管理解決方案既提供了安全性,也提供了便利性。
微軟下調Azure雲服務價格 與亞馬遜競爭
微軟上周下調了其Azure雲存儲服務和Windows Azure Extra Small計算服務的價格。此舉是微軟在亞馬遜下調其Web服務價格幾天之後採取的行動。
這一切意味著什麼?對於IT買主來說,雲計算價格正在迅速下降並且已經與電費水平一樣。考慮到電費受天然氣價格、季節和其它可變因素的影響,雲計算的價格可能更便宜。