哪種Scale out架構能更有效滿足分布式計算?

2020-12-13 至頂網

近些年,隨著「分布式」計算的越來越火熱,Scale out分布式應用架構也如雨後春筍般不斷湧現,大到Big Data平臺架構,小到前端應用App的架構,似乎都要基於Scale out 的架構才算是與時俱進的先進架構。

分布式架構的優勢顯而易見,一方面,Scale out的架構可以將大的計算任務進行分解,分布到不同的計算節點,這樣對每一個計算節點的計算能力要求自然也就下降了;另一方面,Scale out的架構可以在多個節點實現計算負載平衡,任何節點發生宕機都不影響最終結果的達成,換句話說,對每一個計算節點的可靠性要求降低了。那麼,Scale out的架構是否真的需要多臺小計算量的節點來實現才是最完美的架構呢,讓我們來細細剖析什麼樣的Scale out架構才能最有效的滿足分布式計算的特點。

分布式=物理分布 or 邏輯分布?

我們且來看「中國科學技術信息研究所」對於分布式計算的權威定義:「分布式計算是一種新的計算方式。所謂分布式計算就是在兩個或多個軟體互相共享信息,這些軟體既可以在同一臺計算機上運行,也可以在通過網絡連接起來的多臺計算機上運行。」從這個定義我們可以看出:首先,分布式計算是定義的軟體分布式,也就是邏輯分布式,而非硬體分布式,也就是並不是物理分布式;其次,硬體平臺的選擇,是要根據實際情況,把程序放在最適合運行它的計算機上。換句話說,分布式架構指的是邏輯分布,而不是一味強調要用多臺機器去部署,而是要結合實際情況選擇合適的部署架構。

邏輯分布指的是多個邏輯計算節點共同運行同一個計算任務,這些節點可以部署在多個物理節點上,也可以通過虛擬化等方式部署在少量物理節點上,我們把多個邏輯節點部署在一個或少量幾個物理節點上的部署方式稱之為「邏輯分布,物理集中」。

「邏輯分布,物理集中」的部署方式從軟體部署層面來看,是完全的Scale out 架構,再從硬體部署層面看,它又具有集中部署的優勢,可以說是結合了分布式和集中式部署的優勢,同時又摒棄了兩者的缺陷,具有如下優點:

1、高可靠,高容錯性。一個節點的系統崩潰不會影響到其他的伺服器;

2、高可擴展。可以根據計算能力的需要,增加更多的計算節點或者增加某些節點的性能;

3、靈活性。便於實施,同時支持新應用的快速上線;

4、高性能。由多個節點共同提供計算能力,來滿足實際業務需求;

5、易管理,降低運維複雜度。物理集中的部署方式可以減少實際物理機器的數量,降低整體運維複雜度,從而大大降低運維人員的工作量;

6、節能減排。物理機器數量減少了,機櫃位置就減少了,耗電量下降了,對於空調的製冷要求降低了,節能減排,實現「綠色數據中心」的需求。

「邏輯分布,物理集中」意味著物理集中部署的機器要承擔多個邏輯計算節點,那麼這種部署方式對於硬體平臺選擇的要求:

1、高可靠高穩定。放雞蛋的籃子減少了,意味著籃子要足夠紮實,才能保證雞蛋的安全。

2、高可擴展。為了滿足邏輯節點的Scale out橫向增加,那麼物理集中的機器就需要具有強大的Scale up縱向擴展能力,能夠滿足應用節點橫向擴展需求。

3、高性能。如果是單純計算能力的累加,那麼實際上物理並沒有減少,為了實現更高密度的整合,物理集中部署的機器需要具有強大的性能,以更少的資源來整合更多的計算節點。

4、開放性。我們知道分布式計算往往是基於開放式系統的,這就要求伺服器具有強大的開放性,能夠兼容商業或開放平臺的軟體,才能更好支持分布式部署架構。

金融行業大規模負載整合項目實踐

某大型金融機構欲建設一個異地災備數據中心,在應用伺服器的災備架構選擇中,客戶希望選擇一套基礎架構用於承接生產數據中心1400餘套應用伺服器節點,若與生產數據中心保持同樣的架構,則災備數據中心需要200臺4路X86伺服器通過虛擬化的方式來承載,其需求及困難點大致為:

1、因災備數據中心需要在生產數據中心不可用時,完全承接生產任務,因此從性能層面看,災備數據中心應用伺服器平臺必須具有與生產數據中心一致的處理能力,即相當於200臺4路10核X86伺服器的處理能力;

2、災備數據中心與生產數據中心相隔近千公裡,其IT人員均在生產中心就職,災備中心維護力量特別薄弱,若採用200臺X86架構,根據2017年ITIC調查統計的各平臺計劃外宕機時間(參見下圖),每年預計會有10%左右的意外宕機時間,維護壓力大,災備中心可能需要通過新增人力才能滿足;

3、災備數據中心機房空間資源吃緊,雖然現階段可以滿足200臺伺服器的建設需求,但隨未來業務發展,災備數據中心資源瓶頸會日益顯現;

針對於此金融機構的災備數據中心建設需求,在基礎架構選型上客戶面臨兩個選擇,一是在災備中心繼續沿用現有生產中心基於X86的物理分布式架構,但會面臨災備中心運維力量不足,機房空間緊張,甚至電力不足的問題;二是在災備中心選擇物理集中邏輯分布的架構,在保證處理能力相當的清理下,減少物理伺服器的數量,降低維護壓力,減少機房空間佔用和電力消耗。

在詳細了解了LinuxONE的平臺特點後,該金融機構立即聯合IBM啟動了針對LinuxONE的功能和性能測試,一方面驗證LinuxONE的整合能力,即同等工作負載下,LinuxONE和X86各自需要的配置,另一方面驗證LinuxONE針對於分布式平臺的靈活性,如虛機承載能力,瞬時擴展能力等。最後實驗證實,兩臺LinuxONE可以完全承載該金融機構的應用伺服器負載,且LinuxONE平臺在擴展性和靈活性方面更優。特別是在擴容方面,LinuxONE的瞬時微碼激活能力可以秒級提供更多的計算資源,當面臨性能瓶頸時,既可以通過增加分布式節點的方式進行擴容,還能夠通過增加某個或某些個節點的處理能力進行擴容,在不增加節點的情況下,輕鬆應對負載高峰。

用戶最終選定LinuxONE作為其災備數據中心應用伺服器的承載平臺,採用2臺LinuxONE作為災備數據中心應用伺服器平臺,總共部署1400餘個虛機,並納入已有的ICO雲平臺進行統一管理,充分展現了LinuxONE強大的整合能力、無與倫比的性能及其廣泛的兼容性。

在本次項目建設中,LinuxONE表現出強大的整合能力和性能,同時,LinuxONE擁有業內最強大的可靠性和穩定性,完全契合金融機構「快」和「穩」的雙速IT建設需求。

通過採用2臺LinuxONE替代200臺4路X86的架構,在機房空間、耗電、商用軟體許可方面資源節省對比如下:

LinuxONE大規模負載整合成本分析

LinuxONE單臺可提供多達8000個虛機、兩百萬個容器的能力,從TCO的角度看,通過「邏輯分散,物理集中」的部署方式實現「以一頂百」高密度整合,能夠節省大量的電力消耗、機房空間、空調消耗及商用軟體License成本,助力實現「綠色數據中心」,能夠更加節省整體成本投入。同時,由於伺服器數量大大減少了,LinuxONE又都是全冗餘架構的高可靠穩定伺服器,還能進行全在線微碼升級及部件更換,所以運維也都變得開心快樂,不再是勞心勞力的事情,對於運維部門人力吃緊,或者本來就不打算投入太多人力的災備數據中心,LinuxONE無疑是最優選擇。

IT大勢,分久必合,合久必分,隨著各行業業務種類的增多和業務量的增長,各行業都可能面臨伺服器數量眾多、故障點多、運維壓力大、電力消耗大、商用軟體合規成本巨大等問題,上文分享了基於LinuxONE實現大規模負載整合的實踐經驗,謹以此為廣大同仁提供參考。

作者:汪莉,12年IT行業從業經驗,7年IBM系統事業部工作經歷,一直致力於金融行業基礎架構研究及項目管理,積累了豐富的金融行業架構經驗。目前作為IBM大中華區系統事業部LinuxONE架構師,重點負責金融行業和醫療行業的基礎架構設計和技術支持保障。

相關焦點

  • Scale Out將是未來的企業架構
    Scale Up(縱向擴展):指企業後端大型伺服器以增加處理器等運算資源進行升級以獲得對應用性能的要求,但是更大更強的伺服器同時也是更昂貴的,往往成本會大於部署大量相對便宜的伺服器來實現性能的提升,這當中的代表當屬IBM zSeries大型機。而且伺服器性能所能提高的程度也有一定的上限。
  • Scale OUT還是Scale UP?
    Up模式實施成本較高,大到一定壓力之後,硬體可能無法滿足這類需求。從web2.0網站來看,如果能夠通過疊加相對廉價設備的方式實現存儲和計算能力的擴展,是長期可擴展的有效手段,這點是Scale out所帶來的優勢。對網絡存儲來說,共享存儲是必須的。無論數據塊或文件、本地化或遠程,都不希望停留在單處理環境中。
  • Scale-out NAS對比scale-up NAS(下)
    Scale-out NAS 優點  橫向擴展(scale-out)的NAS系統的優勢在於可以根據需要進行容量和性能上的擴展,這遠遠超出了傳統意義上縱向擴展(scale-up)的NAS系統的限制。Scale-out NAS系統通常將數據分布在多個存儲控制器中,通過集群架構來確保系統的高可用性。
  • MPP資料庫CirroData以計算存儲分離架構實現高擴展性與靈活調度
    計算存儲分離是「雲」存在的模式和形態之一,也是最有成本優勢的方式之一。通過將存儲層與計算層做到極致,實現規模經濟與共享經濟,以更少的財務成本滿足業務需求。為了更好滿足市場的迫切需求,新一代基於計算存儲分離架構的資料庫管理技術應運而生,而CirroData資料庫正是在這樣技術換代的背景下出現的。1分析型資料庫的架構演進分為三個階段
  • 分布式系統架構與雲原生—阿里雲《雲原生架構白皮書》導讀
    1.3 雲原生與分布式系統架構的關係  分布式架構的重點在於解決計算力的保障問題以及為了提高計算力並同時確保系統的可靠性、可用性和安全性而產生的諸如彈性伸縮、負載均衡、分布式存儲等問題,其目標是在於構建一個分布式的安全可靠的計算力基礎平臺。
  • 48V分布式電源架構重新定義汽車供電
    功率的增加可以使內燃機更有效地運轉,幫助主機廠更快地滿足排放法規要求。已經推出的具有啟停功能的輕混動力汽車,可以使發動機在滑行、制動或停止時暫時關閉,然後迅速重新啟動,提供部分動力。輕混動力車的電機用於補充內燃機能量,不能單獨為汽車提供動力。支持傳統12V系統的48V電氣系統·回收儲存能量。
  • 企業存儲架構選Scale-up還是Scale-out?
    過去20年的數據交付中,在企業環境中集中使用的是統一存儲基礎架構。這些架構採用了大規模的SAN和NAS產品,具有較高的彈性和可用性,能夠擴展到TB級,甚至能夠擴展到更高的PB級存儲。    毫無疑問的是如今這些規模化的存儲市場表現仍然強勁,但是令人欣喜的是我們開始看到向外擴展的產品,其存儲基礎架構通過擴展節點來滿足用戶更大的存儲需求。
  • 大數據十大發展方向:Scale-out成主流
    相信大多數人都能順口說出大數據的四個特點:容量大,多樣化,速度快以及高價值。但隨著人們對於大數據的逐漸了解,人們開始討論大數據究竟能夠給人們帶來什麼樣的價值?大數據的未來服務方向在哪裡?    方向五:大數據推動基礎架構向Scale-out發展    基礎架構是大數據首先面臨的挑戰,如何讓基礎架構能夠存取更多的數據呢?傳統的基礎架構能否滿足用戶需求呢?目前,來說,雖然基礎架構面臨著一些挑戰,但是當他的挑戰並不是很大,但是隨著大數據行業的發展,而且這種數據的增長將呈現爆炸式增長,就對傳統的架構形成了迎新春。
  • 架構師成長之路:分布式系統綜述
    作為一個資深架構師,一路走來,發現自己的技術水平很多時候其實是隨著項目的發展被迫成長的。其實,很多時候,自身水平達不到能順利完成架構項目的水平,但是,為了挑戰,為了技術成長,更是為了高薪資,只能咬牙堅持,熬夜學習,最終讓自己能順利設計和把控項目的架構。其中,最為艱難的,就是去設計、架構、規劃一整套,規模大的分布式系統。
  • 一文理解分布式架構
    4、分布式webService5、分布式計算舉例以分布式mysql 資料庫中間件mycat 為例    MySQL 在現在電商以及網際網路公司的應用非常多,一個是因為他的免費開源,另外一個原因是因為分布式系統的水平可擴展性,隨著移動網際網路用戶的暴增,網際網路公司,像淘寶,天貓,唯品會等電商都採用分布式系統應對用戶的高並發量以及大數據量的存儲
  • Oracle TimesTen Scaleout為內存資料庫樹立新性能標準
    北京,2018 年 9月6日 —甲骨文近日推出了世界上速度最快的聯機事務處理 (OLTP) 資料庫 Oracle TimesTen Scaleout,助力全球企業機構管理日益增長的資料庫事務負載。Oracle TimesTen Scaleout 依託成熟的企業架構構建,具有大規模擴容能力、超高的事務處理吞吐量以及極快的響應速度。
  • 漫談高端存儲陣列架構
    圖4描述的是基於交換式的架構,該架構通過交換ASIC將前端和後端連接進行數據交換,相對於矩陣直連式,它具有更好的可擴展性,但是問題是如何減少交換時延和交換爭用。目前HDS的存儲系統採用的是該架構。如圖5所示的全分布式架構,該架構將串行降至了最低,使得系統獲得了理論最高加速比。
  • 計算架構演進的必然,邊緣計算引發的產業變革正在開啟
    如同CCF分布式計算與系統專委會副主任郭得科所說,邊緣計算的出現,讓我們有一個新的機會把過去過於集中的計算模式重新否定,站在需求側,用分布式的角度去思考新的計算模式的選擇,這個選擇顯然是邊雲協同。邊雲協同放大邊、雲價值「邊緣計算與雲計算之間不是替代關係,而是互補協同關係」。
  • 用雲的思想構建Scale Out數據中心網絡
    雲數據中心網絡面臨的新需求和新挑戰  眾所周知,雲計算的核心理念是硬體資源池化、軟體全分布化和運行全自動化,這種新的分布式計算架構和存儲架構的基本需求是跨計算節點訪問數據,這使得數據中心內的東西流量遠遠高於數據中心與用戶之間的南北流量,有的場景下甚至會高出40倍,比如搜索等。網絡無阻塞成為支持雲計算的基本要求。
  • 一文詳解:如何設計出高可用的分布式架構?
    本文作者將與大家分享目前主流的分布式架構、分布式架構中常見理論以及如何才能設計出高可用的分布式架構。在分布式架構中,SOA 和微服務架構是最常見的兩種分布式架構,而且目前服務網格的概念也越來越火了,我們就先從這些常見的架構開始。
  • 帶著問題學習分布式系統
    需要學習的技術很多,要自學新知識也不是一件容易的事,選擇一個自己比較感興趣的會是一個比較好的開端,於是,打算學一學分布式系統。帶著問題,有目的的學習,先了解整體架構,在深入感興趣的細節,這是我的計劃。帶著問題出發分布式要解決什麼問題呢?解決持久化數據太大,單個節點的硬碟無法存儲的問題;解決運算量太大,單個節點的內存、CPU無法處理的問題。解決這些問題,有兩種思路:scale up,scale out。
  • 深度學習簡介,GPU計算的原理,分布式機器學習原理
    CPU 由專為順序串行處理而優化的幾個核心組成,而 GPU 則擁有一個由數以千計的更小、更高效的核心(專為同時處理多重任務而設計)組成的大規模並行計算架構。同時CPU相當的一部分時間在執行外設的中斷、進程的切換等任務,而GPU有更多的時間並行計算。2.
  • 邊緣計算:計算架構不斷演進的必然
    據IDC數據顯示,未來超過50%的數據需要在邊緣側進行存儲、分析、計算,到2024年全球邊緣計算市場將達到2506億美元。邊緣計算作為2020年新興技術趨勢的佼佼者,正日益趨向成熟,賦能各行各業,成為支撐新基建戰略,促進行業數位化轉型的重要抓手。 2020年12月10日,由邊緣計算產業聯盟(ECC)主辦的2020邊緣計算產業峰會(ECIS2020)在京盛大召開。
  • Scale-Out擴展有極限 存儲架構如何選?
    談到存儲架構,Scale-Out是目前談的比較多的話題,其能夠給我們提供容量,並且方便我們部署。但是是否意味著其沒有缺點呢?    Scale-Out(橫向擴展存儲系統架構)能夠為一個組織提供數據存儲的容量需求的快速增加,但是問題是,數據中心怎麼向外擴展?當你的數據中心運行在一個房間的時候,你如何擴展數據中心,建立一個新的數據中心?
  • 分布式系列之一:架構的演進過程
    穩定性和可用性這兩個指標很難達到單機系統存在可用性和穩定性的問題,這兩個指標又是我們必須要去解決的 1、了解分布式架構中的相關概念 集群 小飯店原來只有一個廚師,切菜洗菜備料炒菜全乾。