容災是什麼意思?
容災(Disaster Tolerance),就是在自然災害、設備故障、人為操作破壞等的災難發生時,在保證生產系統的數據儘量少丟失的情況下,保持生存系統的業務不間斷地運行。
和容災易混淆的概念
容錯(Fault Tolerance)
容錯和容災最大的區別是,容錯可以通過硬體冗餘、錯誤檢查和熱交換再加上特殊的軟體來實現,而容災必須通過系統冗餘、災難檢測和系統遷移等技術來實現。
災難恢復(Disaster Recovery)
災難恢復和容災的區別是,容災強調的是在災難發生時,保證系統業務持續不間斷地運行的能力,而災難恢復強調的災難之後,系統的恢復能力。
容災備份的區別
備份只能滿足數據丟失、數據破壞時的數據恢復目的,而不能提供實時的業務接管功能。容災往往是針對當生產系統不能正常工作時,其業務可由容災系統接替這些業務,繼續進行正常的工作。
容災必須滿足的三個要素
1、先是系統中的部件、數據都具有冗餘性,即一個系統發生故障,另一個系統能夠保持數據傳送的順暢;
2、具有長距離性,充分長的距離才能夠保證數據不會被一個災害全部破壞;
3、容災系統要追求全方位的數據複製。
容災的指標參數
有兩個關鍵指標我們必須要了解:RTO和RPO。
RTO(RecoveryTimeObjective,恢復時間目標)是可容許服務中斷的時間長度。RTO數值越小,代表容災系統的數據恢復能力越強。提升RTO的常用技術及其RTO的表現見下表:
RPO(RecoveryPointObjective,恢復點目標)是指能容忍的最大數據丟失量,是指當業務恢復後,恢復得來的數據所對應時間點。提升RPO的常用技術及其RPO的表現見下表:
國內外知名的容災軟體
中興新支點Newstart HA
NewStart HA是由中興旗下子公司新支點研發的容災軟體,無需改變任何服務和應用,即可保證系統故障和部件故障時應用不中斷;可以自動監控伺服器、網卡、浮動 IP 、存儲和業務,生產中心失效會自動切換到災備中心;可實現數據實時同步,切換時間為秒級,為系統提供電信級,高達 99.999% 的高可用性。
Data Protector
進口軟體,是存儲提供商大廠之一的HP公司出品,充分考慮了對磁帶庫的支持,不能實現實時備份以及任意回退,但是為了迎合客戶需求,他們增加了業務的連續性保護,當數據備份到磁碟上時,可以快速的回覆業務。
SIMPANA
進口軟體,專業的存儲軟體公司CommVault的旗艦產品,裡面包含了Galaxy和Quick Recovery兩款產品。Galaxy是定位在數據保護上的產品,QuickRecovery加入了高可用的概念。它的產品概念依然延續了國外的標準,分為管理伺服器、介質伺服器和客戶端代理。