RDB快照
概述
在默認情況下, Redis 將資料庫快照保存在名字為 dump.rdb的二進位文件中。你可以對 Redis 進行設置, 讓它在「 N 秒內數據集至少有 M 個改動」這一條件被滿足時, 自動保存一次數據集。
你也可以通過調用 SAVE或者 BGSAVE , 手動讓 Redis 進行數據集保存操作。 比如說, 以下設置會讓 Redis 在滿足「 60 秒內有至少有 1000 個鍵被改動」這一條件時, 自動保存一次數據集:
save 60 1000
這種持久化方式被稱為快照 snapshotting.
何時執行快照
出現下面的情況redis會快照內存裡的數據
用戶發送bgsave命令(此時redis會fork一個子進程,子進程負責生成硬碟文件,父進程負責繼續接受命令)用戶發送save命令(和bgsave命令不同,發送save命令後,到系統創建快照完成之前系統不會再接收新的命令,換 句話說save命令會阻塞後面的命令,而bgsave不會)用戶在配置文件了配置了類似這樣的命令 save 60 1000這個的意思是說,自從上次快照成功算起,如果滿足"60秒內有1000次寫入"這個條件,系統就自動調用bgsave,如 果配置文件裡有多個save命令,只有滿足一個就調用bgsave命令用戶發送shutdown,系統會先執行save命令阻塞客戶端,然後關閉伺服器當有主從架構時,從伺服器向主伺服器發送sync命令來執行複製操作時,只有主伺服器當時沒有進行bgsave操 作,那麼主伺服器就會執行bgsave操作。快照的配置信息
save 60 1000stop-writes-on-bgsave-error no rdbcompression yesdblename dump.rdbdir ./
工作方式
當 Redis 需要保存 dump.rdb 文件時, 伺服器執行以下操作: Redis 調用forks. 同時擁有父進程和子進程。
子進程將數據集寫入到一個臨時 RDB 文件中。
當子進程完成對新 RDB 文件的寫入時,Redis 用新 RDB 文件替換原來的 RDB 文件,並刪除舊的 RDB 文件。這種工作方式使得 Redis 可以從寫時複製(copy-on-write)機制中獲益。
只追加操作的文件(Append-only le,AOF)
概述
快照功能並不是非常耐久(dura ble): 如果 Redis 因為某些原因而造成故障停機, 那麼伺服器將丟失最近寫入、且仍未保存到快照中的那些數據。 從 1.1 版本開始, Redis 增加了一種完全耐久的持久化方式: AOF 持久化。
你可以在配置文件中打開AOF方式:
appendonly yes
從現在開始, 每當 Redis 執行一個改變數據集的命令時(比如 SET), 這個命令就會被追加到 AOF 文件的末尾。這樣的話, 當 Redis 重新啟時, 程序就可以通過重新執行 AOF 文件中的命令來達到重建數據集的目的。
日誌重寫
因為 AOF 的運作方式是不斷地將命令追加到文件的末尾, 所以隨著寫入命令的不斷增加, AOF 文件的體積也會變得越來越大。舉個例子, 如果你對一個計數器調用了 100 次 INCR , 那麼僅僅是為了保存這個計數器的當前值, AOF 文件就需要使用 100 條記錄(entry)。然而在實際上, 只使用一條 SET 命令已經足以保存計數器的當前值了, 其餘 99 條記錄實際上都是多餘的。
為了處理這種情況, Redis 支持一種有趣的特性: 可以在不打斷服務客戶端的情況下, 對 AOF 文件進行重建
(rebuild)。執行 BGREWRITEAOF 命令, Redis 將生成一個新的 AOF 文件, 這個文件包含重建當前數據集所需的最少命令。Redis 2.2 需要自己手動執行 BGREWRITEAOF 命令; Redis 2.4 則可以自動觸發 AOF 重寫, 具體信息請查看 2.4 的示例配置文件。
AOF有多耐用
你可以配置 Redis 多久才將數據 fsync 到磁碟一次。有三種方式:
每次有新命令追加到 AOF 文件時就執行一次 fsync :非常慢,也非常安全
每秒 fsync 一次:足夠快(和使用 RDB 持久化差不多),並且在故障時只會丟失 1 秒鐘的數據。從不 fsync :將數據交給作業系統來處理。更快,也更不安全的選擇。
推薦(並且也是默認)的措施為每秒 fsync 一次, 這種 fsync 策略可以兼顧速度和安全性。
如果AOF文件損壞了怎麼辦?
伺服器可能在程序正在對 AOF 文件進行寫入時停機, 如果停機造成了 AOF 文件出錯(corrupt), 那麼 Redis 在重啟時會拒絕載入這個 AOF 文件, 從而確保數據的一致性不會被破壞。當發生這種情況時, 可以用以下方法來修復出錯的 AOF 文件:
為現有的 AOF 文件創建一個備份。使用 Redis 附帶的 redis-check-aof 程序,對原來的 AOF 文件進行修復: redis-check-aof –x(可選)使用 di -u 對比修復後的 AOF 文件和原始 AOF 文件的備份,查看兩個文件之間的不同之處。重啟 Redis 伺服器,等待伺服器載入修復後的 AOF 文件,並進行數據恢復。AOP重寫原理
AOF 重寫和 RDB 創建快照一樣,都巧妙地利用了寫時複製機制: redis 執行 fork() ,現在同時擁有父進程和子進程。
子進程開始將新 AOF 文件的內容寫入到臨時文件。
對於所有新執行的寫入命令,父進程一邊將它們累積到一個內存緩存中,一邊將這些改動追加到現有 AOF 文件的末尾,這樣樣即使在重寫的中途發生停機,現有的 AOF 文件也還是安全的。
當子進程完成重寫工作時,它給父進程發送一個信號,父進程在接收到信號之後,將內存緩存中的所有數據 追加到新 AOF 文件的末尾。
搞定!現在 Redis 原子地用新文件替換舊文件,之後所有命令都會直接追加到新 AOF 文件的末尾。
怎樣從RDB方式切換為AOF方式
在 Redis 2.2 或以上版本,可以在不重啟的情況下,從 RDB 切換到 AOF : 為最新的 dump.rdb 文件創建一個備份。
將備份放到一個安全的地方。
執行以下兩條命令:
-redis-cli cong set appendonly yes redis-cli cong set save 「」
確保寫命令會被正確地追加到 AOF 文件的末尾。
執行的第一條命令開啟了 AOF 功能: Redis 會阻塞直到初始 AOF 文件創建完成為止, 之後 Redis 會繼續處理命令請求, 並開始將寫入命令追加到 AOF 文件末尾。
執行的第二條命令用於關閉 RDB 功能。 這一步是可選的, 如果你願意的話, 也可以同時使用 RDB 和 AOF 這兩種持久化功能。
重要:別忘了在 redis.conf 中打開 AOF 功能! 否則的話, 伺服器重啟之後, 之前通過 CONFIG SET 設置的配置就會被遺忘, 程序會按原來的配置來啟動伺服器。
AOF和RDB之間的相互作用
在版本號大於等於 2.4 的 Redis 中, BGSAVE 執行的過程中, 不可以執行 BGREWRITEAOF 。 反過來說, 在BGREWRITEAOF 執行的過程中, 也不可以執行 BGSAVE。這可以防止兩個 Redis 後臺進程同時對磁碟進行大量的I/O 操作。
如果 BGSAVE 正在執行, 並且用戶顯示地調用 BGREWRITEAOF 命令, 那麼伺服器將向用戶回復一個 OK 狀態, 並告知用戶, BGREWRITEAOF 已經被預定執行: 一旦 BGSAVE 執行完畢, BGREWRITEAOF 就會正式開始。 當Redis 啟動時, 如果 RDB 持久化和 AOF 持久化都被打開了, 那麼程序會優先使用 AOF 文件來恢復數據集, 因為AOF 文件所保存的數據通常是最完整的。
AOF VS RDB
RDB持久化方式能夠在指定的時間間隔能對你的數據進行快照存儲.
AOF持久化方式記錄每次對伺服器寫的操作,當伺服器重啟的時候會重新執行這些命令來恢復原始的數 據,AOF命令以redis協議追加保存每次寫的操作到文件末尾.Redis還能對AOF文件進行後臺重寫,使得AOF
文件的體積不至於過大.
如果你只希望你的數據在伺服器運行的時候存在,你也可以不使用任何持久化方式.
你也可以同時開啟兩種持久化方式, 在這種情況下, 當redis重啟的時候會優先載入AOF文件來恢復原始的數據,因為在通常情況下AOF文件保存的數據集要比RDB文件保存的數據集要完整.
最重要的事情是了解RDB和AOF持久化方式的不同,讓我們以RDB持久化方式開始:
RDB的優缺點
優點
RDB是一個非常緊湊的文件,它保存了某個時間點得數據集,非常適用於數據集的備份,比如你可以在每個 小時報保存一下過去24小時內的數據,同時每天保存過去30天的數據,這樣即使出了問題你也可以根據需 求恢復到不同版本的數據集.
RDB是一個緊湊的單一文件,很方便傳送到另一個遠端數據中心或者亞馬遜的S3(可能加密),非常適用 於災難恢復.
RDB在保存RDB文件時父進程唯一需要做的就是fork出一個子進程,接下來的工作全部由子進程來做,父 進程不需要再做其他IO操作,所以RDB持久化方式可以最大化redis的性能.
與AOF相比,在恢復大的數據集的時候,RDB方式會更快一些.
缺點
如果你希望在redis意外停止工作(例如電源中斷)的情況下丟失的數據最少的話,那麼RDB不適合你.雖 然你可以配置不同的save時間點(例如每隔5分鐘並且對數據集有100個寫的操作),是Redis要完整的保存 整個數據集是一個比較繁重的工作,你通常會每隔5分鐘或者更久做一次完整的保存,萬一在Redis意外宕 機,你可能會丟失幾分鐘的數據.
RDB 需要經常fork子進程來保存數據集到硬碟上,當數據集比較大的時候,fork的過程是非常耗時的,可能會導致Redis在一些毫秒級內不能響應客戶端的請求.如果數據集巨大並且CPU性能不是很好的情況下,這 種情況會持續1秒,AOF也需要fork,但是你可以調節重寫日誌文件的頻率來提高數據集的耐久度.
AOF 優缺點
優點 -
使用AOF 會讓你的Redis更加耐久: 你可以使用不同的fsync策略:無fsync,每秒fsync,每次寫的時候fsync. 使用默認的每秒fsync策略,Redis的性能依然很好(fsync是由後臺線程進行處理的,主線程會盡力處理客戶 端請求),一旦出現故障,你最多丟失1秒的數據.
AOF文件是一個只進行追加的日誌文件,所以不需要寫入seek,即使由於某些原因(磁碟空間已滿,寫的過 程中宕機等等)未執行完整的寫入命令,你也也可使用redis-check-aof工具修復這些問題.
Redis 可以在 AOF 文件體積變得過大時,自動地在後臺對 AOF 進行重寫: 重寫後的新 AOF 文件包含了恢復當前數據集所需的最小命令集合。 整個重寫操作是絕對安全的,因為 Redis 在創建新 AOF 文件的過程中,會繼續將命令追加到現有的 AOF 文件裡面,即使重寫過程中發生停機,現有的 AOF 文件也不會丟失。 而一旦新 AOF 文件創建完畢,Redis 就會從舊 AOF 文件切換到新 AOF 文件,並開始對新 AOF 文件進行追加操作。
AOF 文件有序地保存了對資料庫執行的所有寫入操作, 這些寫入操作以 Redis 協議的格式保存, 因此AOF 文件的內容非常容易被人讀懂, 對文件進行分析(parse)也很輕鬆。 導出(export) AOF 文件也非常簡單: 舉個例子, 如果你不小心執行了 FLUSHALL 命令, 但只要 AOF 文件未被重寫, 那麼只要停止伺服器, 移除 AOF 文件末尾的 FLUSHALL 命令, 並重啟 Redis , 就可以將數據集恢復到FLUSHALL 執行之前的狀態。
缺點
對於相同的數據集來說,AOF 文件的體積通常要大於 RDB 文件的體積。
根據所使用的 fsync 策略,AOF 的速度可能會慢於 RDB 。 在一般情況下, 每秒 fsync 的性能依然非常高, 而關閉 fsync 可以讓 AOF 的速度和 RDB 一樣快, 即使在高負荷之下也是如此。 不過在處理巨大的寫入載入時,RDB 可以提供更有保證的最大延遲時間(latency)。
備份redis數據
在閱讀這個小節前, 請牢記下面這句話: 確保你的數據由完整的備份. 磁碟故障, 節點失效, 諸如此類的問題都可能讓你的數據消失不見, 不進行備份是非常危險的。
Redis 對於數據備份是非常友好的, 因為你可以在伺服器運行的時候對 RDB 文件進行複製: RDB 文件一旦被創建, 就不會進行任何修改。 當伺服器要創建一個新的 RDB 文件時, 它先將文件的內容保存在一個臨時文件裡面, 當臨時文件寫入完畢時, 程序才使用 rename(2) 原子地用臨時文件替換原來的 RDB 文件。
這也就是說, 無論何時, 複製 RDB 文件都是絕對安全的。
創建一個定期任務(cron job), 每小時將一個 RDB 文件備份到一個文件夾, 並且每天將一個 RDB 文件備份到另一個文件夾。
確保快照的備份都帶有相應的日期和時間信息, 每次執行定期任務腳本時, 使用 nd 命令來刪除過期的快照: 比如說, 你可以保留最近 48 小時內的每小時快照, 還可以保留最近一兩個月的每日快照。
至少每天一次, 將 RDB 備份到你的數據中心之外, 或者至少是備份到你運行 Redis 伺服器的物理機器之外。
#! /bin/bash
PATH=/usr/local/bin:$PATH
redis-cli SAVE
date=$(date +"%Y%m%d")
cp /var/lib/redis/6379/dump.rdb /data01/cache_backup/$date.rdb
echo "done!"
容災備份
Redis 的容災備份基本上就是對數據進行備份, 並將這些備份傳送到多個不同的外部數據中心。容災備份可以在
Redis 運行並產生快照的主數據中心發生嚴重的問題時, 仍然讓數據處於安全狀態。
因為很多 Redis 用戶都是創業者, 他們沒有大把大把的錢可以浪費, 所以下面介紹的都是一些實用又便宜的容災備份方法:
Amazon S3 ,以及其他類似 S3 的服務,是一個構建災難備份系統的好地方。 最簡單的方法就是將你的每小時或者每日 RDB 備份加密並傳送到 S3 。 對數據的加密可以通過 gpg -c 命令來完成(對稱加密模式)。 記得把你的密碼放到幾個不同的、安全的地方去(比如你可以把密碼複製給你組織裡最重要的人物)。 同時使用多個儲存服務來保存數據文件,可以提升數據的安全性。
傳送快照可以使用 SCP 來完成(SSH 的組件)。 以下是簡單並且安全的傳送方法: 買一個離你的數據中心非常遠的 VPS , 裝上 SSH , 創建一個無口令的 SSH 客戶端 key , 並將這個 key 添加到 VPS 的authorized_keys 文件中, 這樣就可以向這個 VPS 傳送快照備份文件了。 為了達到最好的數據安全性, 至少要從兩個不同的提供商那裡各購買一個 VPS 來進行數據容災備份。
需要注意的是, 這類容災系統如果沒有小心地進行處理的話, 是很容易失效的。最低限度下, 你應該在文件傳送完畢之後, 檢查所傳送備份文件的體積和原始快照文件的體積是否相同。 如果你使用的是VPS , 那麼還可以通過比對文件的 SHA1 校驗和來確認文件是否傳送完整。
另外, 你還需要一個獨立的警報系統, 讓它在負責傳送備份文件的傳送器(transfer)失靈時通知你。