乾貨: 五種常見數據複製技術詳解

2021-01-19 架構師技術聯盟



根據IDC的相關數據統計,2018年全球的數據複製存儲市場規模就已經超過了500億美金,而其中而作為數據複製技術重要應用場景的數據備份和恢復軟體市場的規模也同樣蔚為可觀。今天,我們就來聊聊5種常見的數據複製技術。

複製(Replication)是將一組數據從一個數據源拷貝到一個或多個數據源的技術。方式主要分為同步複製異步複製

1、同步複製:要求每一個寫入操作在執行下一個操作處理之前,在源端和目標端都能完成。特點是數據丟失少,會影響生產系統性能,除非目標系統物理上離生產系統比較近。

2、異步複製:在處理下一個操作前,不等待數據複製到目標系統中。特點是複製的數據與源數據有時間差,但這種複製對生產系統性能影響較小。

在災備方案的設計中,數據複製技術的選擇關係到最終災備效果,即RTO與RPO值的大小。根據數據複製技術在不同系統層的應用,可以分為如下五種:


1、基於主機的數據複製技術

基於主機的數據複製是通過磁碟卷的鏡像或複製進行的,業務進行在主機的卷管理器層,對硬體設備尤其是存儲設備的限制小,利用生產中心和備份中心的主機系統通過IP網絡建立數據傳輸通道,數據傳輸可靠,效率相對較高;通過主機數據管理軟體實現數據的遠程複製,當主數據中心的數據遭到破壞時,可以隨時從備份中心恢復應用或從備份中心恢復數據。 

基於主機的數據複製不需要兩邊採用同樣的存儲設備,具有較大的靈活性,缺點是複製功能會佔用一些主機的CPU資源,對軟體要求較高(很多軟體無法提供基於時間點的快照功能),對主機的性能有一定的影響。

英方獨有的基於作業系統層面的字節級數據捕獲與複製技術在實施過程中,首先會做初始化的數據鏡像,然後通過核心的複製引擎,開始旁路監聽所有文件系統的寫操作,例如Rename、SetAttr等,都能準確的捕獲,並通過數據序列化傳輸技術(Data - Order Transfer,簡稱「DOT」)異步傳輸到災備端,完成整個數據的捕獲和複製過程。

△字節級複製技術原理圖

首先,字節級複製的核心引擎工作時,並沒有複雜的數學運算,對生產機計算資源佔用可以忽略,僅僅是旁路捕獲數據。

其次,所有的數據都是從內存中捕獲,並不涉及生產主機存儲的讀取操作,因此數據複製過程不佔用主機的存儲IO資源。

最後,基於字節級的數據複製粒度最小到字節,因此對於帶寬資源的要求極低,是適應於異地遠距離、及面向未來的混合IT環境和雲化架構的一種複製方式。

 

2、基於應用和中間層的數據複製技術 

應用層面的數據複製通過應用程式與主備中心的資料庫進行同步或異步的寫操作,以保證主備中心數據的一致性,災備中心可以和生產中心同時正常運行,既能容災,還可實現部分功能分擔,但是該技術的實現方式複雜,與應用軟體業務邏輯直接關聯,實現和維護難度較高,並且使用應用層面的數據複製會提高系統的風險與數據丟失的風險。

獨立於底層的作業系統、資料庫、存儲,應用可以根據需求實現雙寫或者多寫,從而實現主本和多個數據副本之間的數據複製功能。這種由應用實現的技術,可以在中間件或者應用平臺層面進行封裝和實現,對上面的應用透明,也可以在應用層面實現。

其主要優勢是可根據需求定製、可實現應用和資料庫層面的複製;主要不足是目前市場上沒有成熟、適合傳統IT企業大規模推廣使用的中間件產品。如果完全由應用封裝平臺或者應用來實現,代碼的複雜程度提高,增加了應用的維護成本。

 

3、基於資料庫的數據複製技術 

基於資料庫軟體的複製技術包括物理複製和邏輯複製兩種方式。

邏輯複製是利用資料庫的重做日誌、歸檔日誌,將主本所在站點的日誌傳輸到副本所在站點,通過重做SQL的方式實現數據複製。邏輯複製只提供異步複製,主副本數據的最終一致性,無法保證實時一致性;

物理複製不是基於SQL Apply操作來完成複製,而是通過redo log日誌或者歸檔日誌在副本站點的同步或者異步持久化寫來實現複製功能,同時副本站點的數據可以提供只讀功能。

開放平臺資料庫複製技術則是一種基於資料庫log(日誌)的結構化數據複製技術,它通過解析源資料庫在線log或歸檔log獲得數據的增、刪、改變化,再將這些變化應用到目標資料庫,使源資料庫與目標資料庫同步,以達到多站點間資料庫可雙活甚至多活,實現業務連續可用和容災的目的。

△資料庫日誌分析技術

 

基於資料庫的數據複製是對資料庫記錄級別、表級別容災高可用的基礎技術,英方資料庫容災技術結合了主機複製和資料庫日誌分析的優點,提高了系統應用的靈活性,可實現資料庫應用多活,同時也極大減少了資料庫應用的增量數據傳輸。在細粒度數據容災、廣域雲化容災領域仍然具有廣闊的應用前景。

資料庫語義級的實時數據同步,在資料庫正常使用時,自動完成源端到備端數據的初始化全量複製,並實時監控及同步複製增量數據,其正常流程的狀態轉換及條件如下:


英方i2Active便是基於redo log日誌分析技術的Oracle數據實時複製工具,具有簡單靈活、高性能、非侵入、低影響、低於秒級延遲,低成本的特點,部署和使用也非常簡便。能夠幫助用戶在複雜的應用環境下完成Oracle容災備份、數據遷移、業務數據分發、構建大型數據倉庫等技術數據整合等工作。


△Active資料庫語義級複製


4、基於存儲系統網關的數據複製技術 

存儲網關位於伺服器與存儲之間,是構架在SAN網絡上的專用存儲服務技術。這項技術基於存儲虛擬化技術。

存儲虛擬化的直接定義:在存儲設備中形成的存儲資源透明抽象層,即存儲虛擬化是伺服器與存儲間的一個抽象層,它是物理存儲的邏輯表示方法。其主要目的就是要把物理存儲介質抽象為邏輯存儲空間,將分散繁雜的異構存儲管理整合為統一簡單的集中存儲管理,將人們所面對的眾多存儲問題,由繁化簡(其中包括存儲的讀寫方式、連接方式、存儲的規格或結構等),由散化整(存儲管理)的過程就是存儲虛擬化。

存儲網關通過對於進入的IO數據流提供各類數據存儲服務,大幅提升了在伺服器或者存儲層面難以達到的靈活性、多樣性、異構化等多種存儲服務能力。利用存儲網關,對於後端的存儲數據可以提供遠程數據複製、異構化存儲融合、存儲設備高可用鏡像、快照服務、數據遷移服務甚至於部分存儲網關可以提供精準的持續數據保護連續數據恢復服務。

由於存儲網關卸載了伺服器和陣列的複製工作負載,它可以跨越大量的伺服器平臺和存儲陣列運行,因而使它成為高度異構的環境下的容災技術的理想選擇。另外,由於帶寬優化、數據恢復精細化等方面獨有的優勢,這項技術也成為比較主流的一種災備技術。

這項技術主要爭論點在於性能保障能力的發展程度。近年來,隨著SAN應用的不斷普及,SAN網絡中由異構存儲設備和爆炸式增長的數據量所帶來的管理複雜性、資源利用率低、存儲設備自身數據服務能力低等問題促進了存儲網關的發展和應用。


5、基於存儲介質的數據複製

通過存儲系統內建的固件或作業系統、IP網絡或光纖通道等傳輸介質連結,將數據以同步或異步的方式複製到遠端,從而實現生產數據的災難保護。

採用基於存儲介質的數據複製技術建設容災方案的特點主要是對網絡連接及硬體的要求較高。基於存儲的複製可以是「一對一」複製方式,也可以是「一對多或多對一」的複製方式,即一個存儲的數據複製到多個遠程存儲或多個存儲的數據複製到同一遠程存儲,而且複製可以是雙向的。

存儲複製技術使基於實現存儲磁碟陣列之間的直接鏡像,通過存儲系統內建的固件(Firmware)作業系統,利用IP網絡或光纖通道等傳輸界面連結,將數據以同步或異步的方式複製到遠端。當然,一般情況下這種模式,必須同等存儲品牌並且同等型號的存儲系統控制器之間才能實現,配備低延遲大帶寬也是必要條件之一。

在基於存儲陣列的複製中,複製軟體運行在一個或多個存儲控制器上,非常適合擁有大量伺服器的環境,原因如下:

獨立於作業系統;能夠支持Windows和基於Unix的作業系統以及大型機(高端陣列);許可費一般基於存儲容量而不是連接的伺服器數量;不需要連接伺服器上的任何管理工作。

由於複製工作被交給存儲控制器來完成,在異步傳輸本地緩存較大的時候可以很好的避免伺服器的性能開銷過大的問題,從而使基於存儲陣列的複製非常適合關鍵任務和高端交易應用。


綜述

在實際工作中,並不能說哪類技術就一定優於另一類技術,優勢永遠是一個相對的概念,在實際應用中,企業需要選擇更加適合自身業務場景的技術路線,畢竟只有適合的,才是最好的。


註:部分內容整理於網絡

來源:英方雲


筆者通過總結、歸類和細化「架構師技術聯盟」微信公眾號歷史原創文章,並梳理成電子書,電子書目錄匯總如下,請通過「閱讀原文」連結查看詳情:


《RDMA原理分析、對比和技術實現解析》

《數據備份和副本管理技術全面解析》

《容器技術架構、網絡和生態詳解》

《快閃記憶體技術、產品和發展趨勢全面解析》

《虛擬化技術最詳細解析》

《傳統企業存儲知識完全解析》

《IO知識和系統性能深度調優全解》

《業界主流數據中心存儲雙活完全解析》

《Ceph技術架構、生態和特性詳細對比分析》

《數據中心大二層交換技術詳解》

《VMware雲數據中心(私有雲)解決方案詳解》

《大數據時代數據重刪技術詳解》

《高性能計算HPC技術、方案和行業全面解析》

《Kubernetes技術和實戰總結》

《詳解DPDK和SPDK技術知識點》

《InfiniBand架構和技術實戰總結》

《雲計算PaaS主流軟體、產品和廠商分析》

《Cloud Foundry技術架構詳解分析》

《OpenStack技術和實戰詳解》

《詳解SCM/NVM技術現狀和研究方向》

《NVMe基礎架構和概念詳解》

《NVMe技術標準和原理深度解析》

《VMWare NSX網絡技術深度解析》


溫馨提示:

請識別二維碼關注公眾號,點擊原文連結獲取電子書打包資料匯總和總結。


相關焦點

  • 乾貨!維諦技術(Vertiv)詳解數據中⼼供配電⼋⼤熱點技術趨勢
    供配電系統作為數據中心正常運行的電力保障,其架構設計和產品選型無疑在數據中心整體設計中佔有十分重要地位。在國家新基建和碳達峰/碳中和宏觀政策實施過程當中,如何對數據中心供配電系統進行最優設計和管理,是眾多數據中心用戶面臨的重大問題。   值得一提的是,供配電系統依然是數據中心關鍵的資產和數據中心宕機的主要原因。
  • 大數據常見的5種基本特性分析
    大數據的五種常見基本特性分析   一、非競爭性   現在很多企業,對數據的保護是非常嚴格的   三、會問問題   大數據技術提供了快速的尖端技術,使得大數據處理技術能夠日行千裡。但是如果不選擇正確有效的方向,反而累加為錯誤支付的成本。
  • 數據粘貼只會Ctrl+C就out了,五種選擇性粘貼方法,讓操作更高效
    下面我們就來詳細的學習一下常見的五種選擇性粘貼方法。操作一:選擇性粘貼快速將公式粘貼為數值案例說明:我們日常通過公式查詢數值的時候,一旦公式引用錯誤,當前顯示的數值也會錯誤。所以有時候為了確保數據的準確性,我們需要將公式複製粘貼為數值。
  • 五種常見傳感器的特點介紹
    打開APP 五種常見傳感器的特點介紹 與非網 發表於 2019-10-10 15:16:11 傳感器有哪些,它們的特點是什麼,筆者列舉了幾種常見傳感器,一起來看看吧!
  • 行上行下|2020年腦科學技術乾貨合集
    很開心在過去的一年可以和大家一起成長~今天,我們將從網站匯總、腦電技術、近紅外技術、核磁技術、眼動技術、其他技術、實驗統計、實驗編程、文獻與寫作、科研素養、前沿文獻、書籍推薦、人物採訪、心理健康、其他內容這15個方面進行總結。因為內容太多,我們分為兩期,前面一期主要偏向技術乾貨,後面一期主要偏向科研素養。希望有所幫助!1.
  • 傳統存儲複製技術八大痛點
    災備技術涉及的領域很多,有很多廠商提供了多種技術解決方案,當前比較常見的數據複製技術有幾大類,例如基於傳統存儲的複製技術,技術資料庫的複製技術,
  • 氫燃料電池14種常見問題
    氫燃料電池14種常見問題
  • 乾貨|如何選擇磁珠進行濾波處理?
    片式電感:射頻(RF)和無線通訊,信息技術設備乾貨|這16種PCB焊接缺陷,有哪些危害?乾貨 | 淺談EMI信號是如何產生的乾貨 | 技術牛人分享功率MOSFET的15點經驗乾貨 | 實例教你如何判定雜散來源乾貨 | 一文搞懂二極體的電容效應、等效電路及開關特性乾貨 | 常用的LED驅動電源詳解
  • 高性能Mysql主從架構的複製原理及配置詳解
    複製解決的問題MySQL複製技術有以下一些特點:數據分布 (Data distribution )負載平衡(load balancing)備份(Backups)高可用性和容錯行 High availability and failover複製如何工作整體上來說,複製有3個步驟:master將改變記錄到二進位日誌(binary log)中(這些記錄叫做二進位日誌事件
  • Excel 數據排序,用函數會嗎?會幾個?
    數據統計中,排序是常見的需求。今天教大家三個可以進行排序的函數。從大到小排:在 E2 單元格中輸入以下公式 --> 下拉複製公式:=LARGE($C$2:$C$15,ROW(A1))Large 函數詳解作用:
  • 電容分類以及外觀圖詳解
    歡迎加入技術交流QQ群(2000人):電力電子技術與新能源 905724684在這裡有電力電子、新能源乾貨
  • 五種最常見的溫度傳感器
    溫度控制器是最常見的控制器之一,在電子計算機,小車,廚房家電,中央空調和家庭裝控溫器等機器設備中,大家都能看到溫度控制器的背影。現階段,溫度控制器的五種最普遍種類包含:熱敏電阻熱電偶RTD(電阻溫度探測器)大數字溫度計IC仿真模擬溫度計IC1、熱敏電阻熱敏電阻(即,THERM人RESiStor的)是一種溫度傳感設備,其電阻是其溫度的函數。
  • 神策數據:《十大數據分析模型詳解》白皮書上線!
    今日,神策數據推出數據分析模型系列白皮書之《十大數據分析模型詳解》,基於多維事件模型,總結歸納十大數據分析模型,內附多種分析模型的實際應用場景案例!本白皮書由神策數據諮詢中心負責人徐美玲、宗海英、翟國帥等神策數據團隊成員共同完成。以下內容節選自該白皮書2017年,神策數據曾推出——八大數據分析模型,詳細解釋了各種分析模型的定義、適用範圍、分析思路、使用方法等等,一經推出,好評如潮。
  • Web端即時通訊實踐乾貨:如何讓WebSocket斷網重連更快速?
    * 內容點評:本文內容沒有高大上,但比較乾貨,實用性較高,內容也很通俗,建議可詳細閱讀。文中雖講的是WebSocket,但思想可以延伸應用到基於TCP協議的同類技術中。本文已同步發布於「即時通訊技術圈」公眾號。
  • 絕對乾貨 3D列印SLS技術詳解
    選擇性雷射燒結工藝(Selective Laser Sintering,SLS),該工藝最早是由美國德克薩斯大學奧斯汀分校的C.R.Dechard於1989年在其碩士論文中提出的,隨後C.R.Dechard創立了DTM公司並於1992年發布了基於SLS技術的工業級商用3D印表機Sinterstation
  • 乾貨有五種泡發方法,你都知道嗎?
    在我們日常生活中,把乾貨泡發後,烹製成菜品,不但營養豐富而且還非常美味,乾貨泡發方法有:水發、油發、鹽發、鹼發、和火發,下面小編就給大家介紹以下這五種泡發方法。
  • 乾貨!人體存在感應常見技術分析
    在高檔住宅和酒店中通過傳感器探測屋內是否有人進而控制屋內空調和新風系統的工作是智能家居和智能酒店的重要功能;智能衛生間通過人體存在檢測是否佔用;智能廚衛、智能燈控、智能空調、智慧機器人通過人體存在檢測啟動工作,在智能化時代,幾乎所有的智能化技術都圍繞人而做文章,人體存在感應技術的準確與否就顯得尤為重要,小編接下來針對市面上三種常見人體存在感應技術做一個詳細分析
  • 常見的7種數據分析手段
    本文將為產品經理介紹數據分析的基本思路,並基於此,衍生出 2 個常見方法和 7 個應用手段,希望在數據分析的實際應用中能給大家帶來幫助。一、數據分析的基本思路數據分析應該以業務場景為起始思考點,以業務決策作為終點。
  • 英語常考五種倍數常見表示方法
    新東方網>大學教育>四六級>複習輔導>四級>四級輔導>詞彙>正文英語常考五種倍數常見表示方法   1)
  • 乾貨 | 詳解MOS管原理及幾種常見失效分析
    大部分MOS管的外觀極其類似,常見的封裝種類有TO252 / TO220 / TO92 / TO3 / TO247等等,但具體的型號有成千上萬種,因此光從外觀是無法區分的。對於不熟悉型號,經驗又比較少的人來說,比較好的方法就是查器件的datasheet。裡面會詳細告訴你,它的類型和具體參數,這些參數對於你設計電路極有用。