漫談高端存儲陣列架構

2020-12-13 存儲在線

1 從陣列所要解決的問題說起

通常,業界按照價格、規模、性能等參數講陣列產品劃分為入門級、中端、高端三個級別。陣列往往要求在存取速度、可靠性、容量三者中取得一個權衡,任何一個陣列依據其定位的不同,這三點的權重會有所差別。

在存儲系統中,對於單盤而言,失效可以假定是一個常態。一個擁有幾十甚至上千硬碟的系統中,硬碟的失效不可避免的事情,因此,陣列必須解決可靠性的問題。目前,解決可靠性的技術手段主要是數據冗餘技術,比如RAID技術,通過記錄額外的數據校驗來達到數據恢復的目的。

單盤由於受限於生產工藝,容量總是有限的,而用戶往往希望得到更大的容量,因此硬碟陣列必須完成對多個單盤容量的整合,呈現給用戶大的虛擬的硬碟。本質上,這就是一種虛擬化。

我們知道,物理硬碟的存取速度取決於機械馬達旋轉的速度,考慮到可靠性、散熱、能耗、噪音等因素,轉速不可能做的太高,目前硬碟速度一般在5000RPM-20000RPM之間,因此單盤的存取速度(帶寬)總是很小,陣列需要有效的將多個物理帶寬整合。

2 高端存儲陣列架構

如果按照控制器的個數來對陣列架構進行分類,高端陣列可以分為雙控(參見圖1)與多控兩大類。

2.1 雙控架構

典型的雙控系統中(參見圖1),兩個控制板通過鏡像通道連接在一起,進行數據交換。每個控制板的後端分別接入物理硬碟的環路(通常物理硬碟是雙埠,剛好可以接成兩個環路,見圖1),主機可以通過任何一個控制板接入存儲陣列,並看見統一的LUN空間。

從軟體上而言,由於只需要考慮兩個控制器,和多控系統相比起來,雙控系統的實現較為簡單。

圖1 雙控架構

目前,在所有的高端存儲陣列中,採取雙控架構的只有IBM 2009年推出的DS8000系列。另外,在中低端存儲陣列上基本上都採用雙控架構。

由於雙控系統受限於諸如計算資源、內存、帶寬物理限制等因素,性能不可能做到太高,所以可以見到的絕大多數高端陣列都採取的是多控系統。

2.2 多控陣列架構

基於多控的陣列主要是一些高端陣列系統,比如EMC的VMAX、HDS的VSP,IBM的XIV、HP的P10000和華為的OceanStor 18000等產品。

對多控系統按照連接拓撲進行劃分,多控系統劃可以分為基於總線交換式的架構、矩陣直連架構、全互聯架構、交換式架構。

如圖2展示了基於總線交換式架構的邏輯結構。目前已經沒有廠家採用這種架構,EMC和HDS的早期產品都曾經採用這種架構。該架構的缺點是可擴展性不強,且由於基於總線,存在總線爭用。

如圖3是基於矩陣直連式的存儲陣列架構,EMC的上一代產品DMX-4就是採用該架構,該架構的前端和後端採取矩陣式直接連接,缺點是可擴展性很差,同時由於連接信號線數目眾多,在一定程度上也降低了系統的可靠性,目前EMC已經棄用該架構。

圖4描述的是基於交換式的架構,該架構通過交換ASIC將前端和後端連接進行數據交換,相對於矩陣直連式,它具有更好的可擴展性,但是問題是如何減少交換時延和交換爭用。目前HDS的存儲系統採用的是該架構。

如圖5所示的全分布式架構,該架構將串行降至了最低,使得系統獲得了理論最高加速比。

由於該系統的所有資源,包括計算資源,內存資源,磁碟資源都分散的足夠開,存在資源爭用的可能性極小,所以,圖5的系統具有更好的性能,更好的可擴展性,同時也擁有更低的成本。 目前市場上最新一代高端存儲陣列HP P10000,EMC的VMAX 40K,華為HVS都採用這種全分布式架構。

3 高端陣列架構實例分析-華為OceanStor 18000

圖6 華為高端陣列OceanStor 18000系統架構

華為OceanStor 18000採用智能矩陣式系統架構,如圖6所示,也是一種基於完全分布式的架構,所有的計算資源 (CPU),緩存,帶寬等資源都均勻分布於每個節點中,在該架構下,不再存在全局緩存爭用問題,串行化達到最低,使得系統獲得了理論最高加速比,具有更好的可擴展性。華為OceanStor 18000是目前業界擴展能力最強,性能最高的高端陣列,最大可以擴展到16個控制器,3TB Cache, 3216塊硬碟,隨機IOPS達到100萬IOPS以上。

3.1 基於PCIe的全交換架構

OceanStor 18000的全交換架構基於PCIe協議,PCIe協議是一種高性能、高帶寬,成熟、穩定的串行通訊互連標準。OceanStor 18000以雙平面PCIe交換作為節點間互連。這種架構設計具有如下的優點:

高可靠:所有部件全冗餘,控制器間負載均衡和Failover,單個控制器失效不影響業務運行

高擴展性:具備scale-out能力,從2個控制器起配,最多支持16個控制器,系統的容量、性能按需擴展

高帶寬:整個交換平面可提供192GB/s的交換帶寬。

方便部署:OceanStor 18000的PCIe鏈路通過光纖連接,同一OceanStor 18000系列產品的機櫃允許跨數十米進行部署,允許布局在不同房間、甚至不同樓層。使得客戶真正實現完全Scale-out的部署,降低了對數據中心機房的環境要求。

3.2 塊級虛擬化

前面講到單盤失效可以認為是一個常態,單盤失效後,RAID組會重構數據,但傳統的RAID重構耗時較長,如果重構過程中又發生了硬碟失效,那麼整個RAID的數據就丟失了。OceanStor 18000採用了塊虛擬化技術,可以很好的解決以上問題。下面我們看一下塊虛擬化的實現細節。

 

 

全虛擬化設計,就是把硬碟分割成若干小塊,稱為CHUNK,然後按照特定算法,從若干硬碟上選取若干CHUNK,按照一定的RAID方式組成CHUNK Group。而LUN,則是由若干CHUNK Group組成。塊級虛擬化架構給硬碟可靠性帶來的最大提升是使系統中每個硬碟都在「均衡」的工作,每個硬碟的忙閒度基本一致,不會像傳統RAID那樣,各個RAID組中的硬碟工作負荷不同,導致某些繁忙的硬碟「過勞死」。

塊級虛擬化帶來的另一大好處是重構時間大幅縮短,RAID降級狀態不但使數據處於「危險」的邊緣,同時也會降低RAID組的性能。塊級虛擬化使得重構產生的負荷分散到更多的硬碟上,單盤重構的壓力變小,大大縮短了重構的時間,大幅降低RAID組失效概率,從而增加了系統的可靠性。

4 總結

高端存儲一般應用於用戶核心業務環境,承載著關鍵數據,對陣列的穩定性,性能和擴展性要求極高,而存儲架構是這一切的基礎。可以預見,模塊化分布式Scale-out架構所帶來的穩定性,性能容量線性擴展的好處將主導未來一段時間高端陣列的設計,同時更多容量、新型介質的出現(SSD)決定了高端陣列中將越來越多的應用虛擬化技術提高存儲資源利用率。

相關焦點

  • 智能時代,高端存儲何去何從?
    圍繞高端存儲的話題熱度居高不下,也引發不少業界朋友關於分布式存儲、超融合、軟體定義存儲、雲存儲、中端存儲的討論。 細品如今分布式架構和雲存儲發展迅猛的趨勢,以及高端存儲特性下移、中端存儲與高端存儲界限模糊,對比過去風起雲湧的三十年紛爭,一向「能抗能打」的高端存儲顯然經受住了歷史考驗。而在日新月異的當下,湧出了很多質疑聲:智能時代,是否還有高端存儲的概念?
  • 萬變歸宗:關鍵業務看高端,高端存儲看架構
    相應的傳統高端存儲市場雖然在緩慢收縮, 但仍是很多大型企業關鍵數據平臺的首選存儲基礎設施。甚至可以說,高端存儲裡的高可靠架構和亮瞎眼的高級數據服務,是AFA打馬狂追的方向。(說的遠一些,沒準高端和AFA這倆以後兩個巴掌拍在一起了,變成基於固態介質的高端存儲呢,到時候高端存儲還是關鍵業務領域的「世間始終你好」。)剛才扯得遠了,現在咱看乾貨。存儲系統是否可靠是關鍵業務得以穩定運行的根本。
  • PROMISE展出多媒體剪輯用磁碟陣列存儲
    磁碟陣列存儲領導廠商PROMISE Technology Inc.宣布即將於九月份在荷蘭阿姆斯特丹開展的IBC數字廣電展中,展出全線針對數字多媒體廣電、剪輯設計的磁碟陣列存儲設備,提供光纖存儲區網(FC SAN)及直接連結存儲(DAS)等多種彈性化的連結方式,並透過Thunderbolt及8G FC等高速傳輸速度,提供更高的實時帶寬,加速影音剪輯和轉播的流程。
  • 2018Gartner通用存儲陣列魔力四象限回答你
    同樣在11月發布的2018Gartner通用存儲陣列魔力四象限報告,其中華為存儲的提升,恐怕又會讓外界再次感嘆「又是華為」,只是在這一聲感嘆背後應該會多一份答案。全球權威的諮詢分析機構Gartner發布的通用存儲陣列魔力四象限報告代表了該領域市場上最頂尖企業的對照情況。
  • 深入理解Google TPU的脈動陣列架構
    要真正理解脈動陣列,首先要問的就是發明者的初衷。這正好也是1982年H. T. Kung論文的題目[1]。對於為什麼要設計這樣的架構,作者給出了三個理由:1. Simple and regular design:可以說,簡單和規則是脈動陣列的一個重要原則。
  • EMC發布Symmetrix DMX-2 提升高端存儲領先地位
    Symmetrix DMX產品系列基礎上的增強,幫助客戶更好的適應日益複雜、苛刻的高端工作負荷,提升了高端存儲的領先地位。新的AutoSwap軟體允許客戶重新定向大型機存儲工作負荷,無須中斷應用處理。鏡像,奇偶RAID 或新的RAID 5實施選項為客戶提供了額外的挑選餘地,使他們獲得低成本高性能的數據保護。對SRDF/A提供多陣列支持?
  • QingStor NeonSAN躋身塊存儲市場前四 媲美中高端全閃陣列
    隨著數位化轉型的推進,新興產業的發展將大量依賴於雲端的計算與數據存儲。對於企業來說,在業務和應用快速發展的今天,想要適應市場,必然要從傳統架構向雲架構轉型,這一點至關重要。而在實施過程中,存儲往往是最重要、又是最艱難的一環。
  • NetApp更新FAS6200存儲陣列
    雖然快閃記憶體陣列是NetApp昨天發布的重點,不過該公司同時也用更大的磁碟、快閃記憶體池、更多的記憶體和最新的ONTAP軟體更新了它的高端FAS6200陣列。我們可以更新一下我們第一次關於這些新FAS陣列所編制的表格。
  • 雲計算埋葬陣列?達沃時代用新融合架構叫板EMC
    對於傳統存儲陣列而言,再怎麼Scale-out也總有天花板,況且昂貴的陣列也未必適合海量的價值密度較低的非結構化數據,也就不如更加廉價的通用伺服器集群,SSD和冗餘的應用會彌補它相對於盤陣的性能和可靠性的短板。目前,在大數據領域佔據絕對統治地位的,確實是以Hadoop集群為代表的分布式系統。
  • 存儲產品選購攻略之--MAIWO磁碟(陣列)櫃!
    磁碟(陣列)櫃是多個大容量硬碟的集合體,具有數據存儲速度快、存儲容量大、安全可靠等優點,所以,磁碟(陣列)櫃非常適合具有海量數據存儲和數據安全需求的企業或個人用戶。無論是企業用戶,還是個人用戶,對於數據的存儲的容量和安全,都有迫切的需求,選擇一款適合自己的磁碟(陣列)櫃,是數據安全的保證。那麼,面對各種品牌,各種功能、各種價格的磁碟(陣列)櫃,用戶該如何作出正確的選擇,讓自己的數據存儲更安全、更快捷呢?    我們從MAIWO(麥沃)專業移動存儲的KF系列磁碟(陣列)櫃來一一分析,幫助用戶作出最正確的選擇。
  • 常見三種存儲方式DAS、NAS、SAN的架構及比較
    隨著主機、磁碟、網絡等技術的發展,對於承載大量數據存儲的伺服器來說,伺服器內置存儲空間,或者說內置磁碟往往不足以滿足存儲需要。因此,在內置存儲之外,伺服器需要採用外置存儲的方式擴展存儲空間,今天小諾給親們分享一下當前主流的存儲架構。
  • 企業存儲架構選Scale-up還是Scale-out?
    過去20年的數據交付中,在企業環境中集中使用的是統一存儲基礎架構。這些架構採用了大規模的SAN和NAS產品,具有較高的彈性和可用性,能夠擴展到TB級,甚至能夠擴展到更高的PB級存儲。    毫無疑問的是如今這些規模化的存儲市場表現仍然強勁,但是令人欣喜的是我們開始看到向外擴展的產品,其存儲基礎架構通過擴展節點來滿足用戶更大的存儲需求。
  • Nimble Storage撬開中國混合型存儲市場_存儲在線
    Nimble的CASL技術揭秘Nimble推出其產品後的3年左右時間裡,在全球能夠很快獲得1300多個用戶的認可,這與其獨有的專 利CASL分不開的,即緩存加速順序布局(CASL:Cache Accelerated Sequential Layout)架構,使得存儲系統具有線性的性能擴展、完備的數據保護、無與倫比的高效和一鍵部署管理等特性
  • 博融雲服務分享混合存儲陣列適合那些數據類型?
    由於需要服務於不同的數據存儲需求,大多數大型數據中心都會同時使用多種類型的存儲設施。 鑑於成本問題,很少有企業能夠(不計成本地)將全部數據都放在市場上能買到的最快但也最昂貴的快閃記憶體存儲中,因此混合使用快閃記憶體和硬碟驅動器的混合陣列將是許多數據中心的主要存儲構成。
  • 各類磁碟陣列全面詳解
    ,RAID),全稱獨立磁碟冗餘陣列。 應用場景: 1、 對數據完整性要求不高的場景,如:日誌存儲,個人娛樂 2、 要求讀寫效率高,安全性能要求不高,如圖像工作站 架構圖: 2、 提供良好的讀性能 缺點: 1、 無數據校驗 2、 磁碟利用率低,成本高 應用場景: 1、 存放重要數據,如數據存儲領域 架構圖:
  • Gartner發布通用版磁碟陣列魔力矩陣
    在存儲這一塊,以前Gartner分別按照高端存儲、中端存儲等等發布魔力矩陣。存儲版圖在改變。Gartner因應這一改變,最近發布「通用磁碟陣列」魔力矩陣,對廠商的存儲產品線進行綜合的考量,包括中端存儲、橫向擴展存儲和企業級存儲。
  • 做存儲雙活是好,但不能白白浪費了存儲陣列軟體
    存儲雙活的架構設計,從不同的供應商的產品特點出發,大致可以歸納為幾類:主機卷鏡像、虛擬化存儲網關、外置雙活存儲網關和存儲內嵌雙活+CDP等幾種架構,其中絕大多數存儲雙活選擇,由於其架構設計,在實現存儲雙活後,主機端與存儲(功能)端被人為的分割開來,從而無法利用陣列本身軟體,軟體定義存儲也就無從談起了。為什麼會發生這樣的事情呢?還要從其中幾種架構的設計思路說起。
  • Dell EMC發布PowerStore,存儲基礎架構性能和靈活性突破性進展
    作為企業級存儲領域的行業領導者,戴爾科技集團(NYSE: DELL)宣布推出一款全新的現代化基礎架構平臺——Dell EMC PowerStore。PowerStore以卓越的現代存儲技術和專業能力為起點,幫助企業應對數據時代的挑戰。
  • MPP資料庫CirroData以計算存儲分離架構實現高擴展性與靈活調度
    SMP (Symmetrical Multi-Processing),對稱多處理技術,是指在一個計算機上匯集了一組處理器(多CPU),各CPU之間共享內存子系統、總線結構、以及磁碟陣列存儲,也就是所謂的shared-everything架構。這種技術採用scale-up的方式擴展計算性能,CPU最大能力存在上限,可擴展性差,常見幾個到十幾個CPU,高端產品可以擴展到幾十,很難做到上百個CPU。
  • RAID6的應用 存儲伺服器陣列技術解析
    大家都了解,做存儲伺服器自然離不開的就是磁碟陣列,在家用級市場我們通常看到的是RAID0、1、10,而在企業級市場則採用RAID5、50、6、60等磁碟陣列方式,這樣可以在保證性能的同時又不犧牲安全性。存儲伺服器主要有幾大優勢,特別適合監控等行業,大數據的存儲備份也不錯。首先,成本比較低如果按每GB價格算的話,存儲伺服器是最低的。