大家聖誕節好。
平安夜過了,今天不提剩蛋的事情。
但昨天的文章必須做一個勘誤,NETAPP通過發布新產品FAS8000超過了HDS,而不是EMC。EMC還是第二。感謝網友的指正。
還有網友建議西瓜哥不要分享DCIG的報告,說會誤導讀者。其實,西瓜哥雖然也認為DCIG的報告不特別有參考意義,但人家能夠生存下來,必有人家的可取之處。因此,我還是相信我們的讀者,相信我們的讀者會判斷這份報告的價值。
今天,我們來聊聊大容量硬碟的PK情況。話說美國有一個很厲害的雲備份公司Backblaze,因為其價格戰而聞名遐邇。由於便宜,因此用戶眾多,數據量很大,現在每天有130TB的新數據。
目前,服役的硬碟有4萬塊,保存了100PB的數據。
由於其運營的數據實在夠大,因此,Backblaze針對HDD的統計數據也非常引入關注。
比如,Backblaze針對硬碟價格的統計。我們可以看到不同容量硬碟的價格趨勢,甚至可以看到泰國洪水對硬碟產業的衝擊。
當然,其最廣為存儲人士熟知的還是針對各個廠商的硬碟故障率的統計。上次這個統計數據發布後,西瓜哥也在「高端存儲知識」裡面有過評論,希捷和很多大V也做了很多解讀。不管怎麼說,在硬碟的故障率統計方面,希捷是暫時落後西數了。
現在全球主要的硬碟廠商就是希捷、西數(日立已經是西數的一部分了)和東芝了。因此,希捷和西數的PK大家關注很多。
隨著6TB大容量硬碟的推出,類似Backblaze這樣追求成本的雲備份公司已經按捺不住,開始嘗試使用6TB的大容量硬碟。但到底選擇希捷還是西數,需要在實際環境下測試使用一下。
Backblaze使用的方式,是把硬碟分成一個個池,每個池包含45個硬碟。為了比較,每個池採用同一個品牌的硬碟。 硬碟的型號是Western Digital (WD60EFRX) 和Seagate (STBD6000100) ,他們都是6TB的大容量硬碟。為了比較,他們還測試了4TB HGST的硬碟。因此,一共三個硬碟池。硬碟池除了硬碟不同,其他配置完全一樣。
Blackblaze的數據採用分布式算法,把數據的負載平均分配到各個硬碟池裡,如果一個池比較忙,就找下一個。每個池寫滿80%就停止。
這個是不同的硬碟池上線後每天增加的數據量曲線:
這個是上線後每天累計數據總量曲線:
由於這三個硬碟池並不是同時上線的,因此,按照日曆日來作為橫坐標來顯示自然日數據增加量曲線:
細心的讀者可能已經看出,西數的性能要好。這個是量化的結果:
我們看到,西數的硬碟池性能最快,甚至比HGST 4TB的性能還好一些。而希捷再一次輸給了西數。
關鍵是希捷的6TB硬碟還是7200 RPM的,耗電量比西數的5400 RPM還高一些。因此,大家不要以為轉速越快性能就好。
Backblaze在Blog裡還給出了幾個結論:
上電可靠性——不錯,沒有硬碟故障
運行可靠性——不錯,運行了3個月,沒有硬碟故障
SMART狀態(3個月)——以前西瓜哥講過,Backblaze使用5個SMART參數來判斷硬碟是否快失效。不錯,這些參數都沒有報錯
能源使用情況——希捷的轉速高,因此耗電略高一些。
數據加載速度——西數領先希捷,大約平均每天多1TB多。
Backblaze說,下一步他們要擴大6TB硬碟的測試規模,已經又訂購了230塊西數的硬碟。
但希捷是否就沒有機會了呢?也不是,Backblaze說,為了保持多樣性,因此也會繼續購買一些希捷硬碟來繼續測試。這個思路也是很多存儲廠商的思路,因為一個部件只有一個供應商是風險非常大的。
最後,Blackblaze認為,西數的勝利稍縱即逝。因為他們已經訂購HGST 8TB氦氣硬碟進行測試,只是目前氦氣硬碟的單價太高。現在,希捷也推出了8TB的SMR硬碟,一塊$260。因此,一場新的大容量硬碟PK又將來臨。
好,Backblaze的測試結果我們分享完了,我相信對很多做冷存儲的Startup公司,這些數據還是有一些參考意義。只是可憐了希捷,怎麼每次在Backblaze的測試中結果總不是太好。是否Backblaze的負載特別不利於希捷啊?難道是時也,命也?
希捷的朋友如果針對今天的文章有澄清的地方,請聯繫西瓜哥。
今天就分享到這裡。大家可能奇怪今天這麼早發出,主要是今天落單了,又沒有約到飯局,還沒有回家呢。肚子餓了,不寫了,去買點零食當飯吃,新聞聯播你也看完了,可以發出了。
明天見。