隨著國內外形式的變化,「自主可控」成為國內上雲的新追求,「自研」也成為To B服務商的一個新型考核標準。
作為國內市場份額排名第二的雲服務商,成立6年的騰訊雲也在此時決定推出第一款「自研」伺服器星星海。從整個雲計算市場來看,騰訊雲此時推出自研伺服器並不算早,因為無論是阿里雲、華為雲、百度雲此前都推出過以「自研」為標籤的伺服器產品。
騰訊云為什麼在這個時間推出自研伺服器,這是否證明自研伺服器市場還存在空缺?
騰訊伺服器供應鏈總經理劉裕勳發布自研伺服器星星海
從對騰訊伺服器供應鏈總經理劉裕勳的採訪中,鈦媒體發現,騰訊雲的星星海伺服器走的其實還是差異化路線。功能上來看,阿里自研伺服器神龍主打的是高性能計算場景,而華為雲與百度雲的則以AI切入。劉裕勳向鈦媒體表示,星星海伺服器提出了「為雲而生」的概念,該伺服器基於AMDA最新ROME平臺定製,專門為公有雲設計,企業用戶可以以更低功耗、更低成本使用個性化的雲計算資源。
滿足公有雲用戶的「個性化」需求
劉裕勳看來,騰訊自研的星星海伺服器其實是公有雲需求以及產業網際網路理念兩相結合下的產物。
以往來看,為了追求更大的市場,滿足各個行業對伺服器的普適性需求,傳統廠商做出的伺服器會是各種功能堆砌出來產品,因此他們做不到對企業客戶個性化需求的滿足。而隨著上雲進程的推進以及產業網際網路下沉,各個行業客戶對伺服器需求的個性化越來越凸顯出來。
星星海伺服器亮相騰訊全球數字生態大會上海站
星星海伺服器的目的正是在這一條件下,滿足不同行業客戶對伺服器的多樣化需求,於是,騰訊雲開始考慮對傳統伺服器「動刀」。
據了解,傳統伺服器為了將功能做到大而全,在用料上會顯得比較「重」,而星星海的一大特點是在傳統伺服器的基礎上做了精簡。
「相比傳統伺服器,星星海用料精簡超過20%。」劉裕勳介紹。他表示,這個精簡體現在兩個方面,一方面是重量的減輕,騰訊雲在星星海伺服器中採用了先進的日虹散熱技術,換掉了傳統伺服器中較重的散熱片,散熱性能提高50%,這也同步促進了伺服器能耗的下降。
另一方面,精減還體現在星星伺服器去掉了那些公有雲場景用不到的功能。「傳統伺服器很多功能不是為雲(公有雲)而做的。」劉裕勳舉例,傳統伺服器為了達到高容災的需求,會安裝本地硬碟保證數據不丟失。但在實際操作過程中,即使是一塊普通硬碟,每天產生的數據都會達到T級別,數據恢復起來往往需要幾天甚至一周,這並不能滿足網際網路敏捷業務的需求。
為此星星海精簡掉了傳統伺服器中的「本地硬碟」,採用無盤伺服器架構,通過高效雲盤CBS的分布式存儲能力代替傳統伺服器中的本地硬碟。這不僅可以降低數據丟失率,同時也避免了本地硬碟遭遇故障後,數據恢復時效較長的問題。
星星海伺服器介紹中,遊戲是其主打場景
產業網際網路下的軟硬體協同理念
除了針對公有雲場景,星星海伺服器也貫穿了軟硬體協同的理念。劉裕勳說,星星海中的自研技術實際上起到的是一個承上啟下的作用,這裡的「下」指的是AMD生產出的行業通用伺服器,「上」指的是騰訊需要在伺服器中構建的的計算、資料庫、存儲等多種產品。
鈦媒體了解到,AMD ROME平臺下對外發布的這一代伺服器,單核CPU均為32核和64核,而騰訊深度定製的這款星星海伺服器的CPU是市面上沒有的48核。這是騰訊雲兼顧伺服器整體的內存及軟體開銷所做的決定。
公開資料顯示,阿里雲的自研神龍伺服器是96核,華為雲推出的自研AI伺服器最高核數為32。為什麼騰訊雲的這款星星海一定要是48核,騰訊團隊發現,只有在48核的情況下,伺服器主頻、核數以及性能可以達到最佳頻率,如果換一個更高CPU伺服器能耗就會上去,跟數據中心的貼合就會有一點問題。
劉裕勳做了個比較形象的比喻:「比如一張桌子能夠坐10個人,如果這10個都是200斤的大胖子其實非常擁擠的,這個大胖子就相當於伺服器中的高功耗、多核數的一個CPU。當這個胖子坐在那裡的時候不會感覺到什麼,但在實際運作過程當中,上菜也困難、夾菜也困難等一系列運營問題就會發生。」
打破了傳統硬體按部就班的設計流程,因此軟硬體協同對硬體如何創新也提出了更高的要求,需要硬體設計者用全新的視角考慮問題。「星星海不是一個KPI工程,所有功能都要現網實測,上面的軟體和下面的硬體如果性能不達標,就需要精確判斷到底是軟體問題,還是硬體問題,各個產品團隊要進行充分的溝通。」
經過一系列的軟硬融合,星星海伺服器可以支持NVME存儲、HDD存儲、高效能計算等多種應用,也可以應對未來3-5年的伺服器產品演進。預計今年年底星星海的部署量會達到5000臺左右,除夕夜的QQ或微信搶紅包場景可能就會運行在星星海伺服器上。(本文首發鈦媒體,作者/秦聰慧)