雲計算像水和電一樣,成為數字經濟時代不可或缺的基礎設施。怎樣讓雲更穩更快?如何構建高效全能、靈活易用、穩定可靠的基礎設施?這是雲計算提供商思考的首要問題。
為此,騰訊雲和希捷一直在緊密協作,引入新品、聯合測試、驗證優化,通過構建可靠的基礎設施,為數據價值的深度挖掘和激活打下穩健根基。
具體說來,針對騰訊雲自研伺服器的研發、測試,數據的保護和恢復、硬碟的固件定製與健康管理等方面,雙方共同攜手,保持著緊密的技術溝通,共同打造穩定、可靠、高可用、可擴展的數據存儲方案。
充分測試騰訊自研伺服器,提升系統可靠性可用性
伴隨騰訊雲業務規模的快速增長,基礎設施架構與運營成本面臨重大挑戰。自研伺服器對騰訊雲的重要性不言而喻。騰訊雲自研伺服器專注於騰訊獨特的應用需求,在散熱、功耗、性能、成本等方面相較標準化伺服器均有一定差異。
在騰訊雲自主開發的伺服器產品投入使用前,雙方就針對伺服器樣機,導入希捷銀河系列企業級硬碟進行測試。聯合實驗測試關注硬碟在系統層面的表現,針對兼容性、抗震性、性能、可靠性進行了測試,確保希捷產品能夠在騰訊自研伺服器中順利運轉,進而提升騰訊雲自研伺服器的整體性能與密度,並幫助最終用戶降低總體擁有成本。
在聯合測試的過程中,希捷產品的抗震性、性能、可靠性、兼容性得到充分驗證。希捷也聆聽到騰訊雲的需求和建議,從而對下一代硬碟產品優化設計。
易失性寫緩存數據丟失檢測,提升數據恢復效率
在雙方的技術協作中,數據安全是非常重要的研究項目。希捷和騰訊雲一直努力尋求更為可靠的數據安全保障。易失性寫緩存數據丟失檢測(data loss detection)就是希捷專為騰訊雲定製的研發項目。希捷基於硬碟自身機制,開發相關技術,並配合騰訊雲的上層指令來消除數據丟失風險。
Fleet management硬碟健康管理,改善用戶體驗
Fleet management硬碟健康管理是雙方共同探索的一個重點。2017年11月開始,希捷開始為騰訊雲部署FARM(Field Accessibility Reliability Metrics),基於大數據機器學習的健康監測建模;並於近期開發了硬碟在線故障診斷工具(Field Events Log)。該項目旨在重塑硬碟日誌以及進行故障預測,從而保障硬碟的可靠性及數據安全。
通過部署FARM項目,希捷聯合騰訊雲對硬碟的運行數據(磁頭數據、碟片數據、溫度、溼度等數據)進行檢測,應用大數據建模分析存在失效風險的硬碟。
通過大數據分析,該項目可提前15天上報不同風險等級的預警,提示用戶採取措施以避免硬碟批量失效導致的業務和數據風險。
定製固件,全面優化產品並降低成本
希捷還為騰訊雲專門定製固件,優化產品特性。定製化全面體現在產品的研發設計、固件優化、前期生產製造控制、後期測試、調試等等環節。
通過定製固件,希捷在多個產品系列中為騰訊雲進行了優化。定製產品已經大量生產並應用在一線。定製化以後,產品質量和用戶體驗均得到了顯著提升。
Fleet Management硬碟健康管理與定製化兩項技術相得益彰,助力客戶年換盤率和硬碟非故障換盤率顯著降低;不僅提升產品質量,更大幅降低成本。
截至目前,騰訊雲和希捷的合作已超越了產品測試層面,雙方還積極參與到產品研發、架構設計、驗證部署等過程。希捷的工程師團隊在針對騰訊的特定工作負載與特定應用,探索如何提升產品性能、降低延遲、不斷調優,以適配騰訊雲的應用需求。
「產業智變,雲啟未來」,面對未來高速變化的市場,希捷還將與騰訊雲繼續攜手,讓雲計算至快至穩。