雲計算基礎設施軟硬一體化,騰訊雲如何「舊路新走」?

2021-01-10 鄭凱Kay

雲計算正迎來屬於它的黃金十年。

中國信通院數據顯示,2019年,全球雲計算市場規模達到1883億美元,增速20.86%。預計2023年市場規模將超過3500億美元。在國內市場,2019年雲計算市場規模達1334億元,增速38.61%。其中,公有雲市場規模達到689億元,較2018年增長57.6%,規模首次超過私有雲。

雲計算歷史性發展的背後,是一部產業變遷史。IT基礎設施從主機時代的集中,到PC時代的離散,雲計算的興起,再一次將IT基礎設施集中化,IT產業似乎也在遵循著「否定之否定」的鐘擺定理。

隨著算力趨於集中,雲計算基礎設施也在經歷新一輪的變化。軟硬一體,一個不甚新鮮的詞彙,在不同時代卻有不同的內涵,雲計算時代的軟硬一體如何演進?

騰訊雲自研伺服器上新,堅定戰略布局

在騰訊2020 Techo Park開發者大會,騰訊雲重磅發布星星海首款自研GPU伺服器和星星海新一代自研雙路伺服器,後者也是國內首款搭載第三代英特爾至強可擴展處理器(Ice Lake)的雙路伺服器。

早在2019年10月份,騰訊雲就發布了首款基於AMD平臺的星星海伺服器,持續不斷地發布自研硬體新品,說明騰訊雲絕對不是「玩票」性質。

星星海首款自研GPU伺服器在設計上實現了全球首創,機框最短,適配主流機架,在同一框架內可以靈活更換主板,並且支持多平臺兼容。同時結合業務對PCIe帶寬要求低的特點,支持16卡GPU+4路intel伺服器,達到業界最高密度,可大幅降低單卡TCO。

星星海新一代自研雙路伺服器率先採用第三代英特爾至強可擴展處理器,經測試,星星海新一代自研雙路伺服器通過深度優化定製,計算密度提升50%;通過高性能散熱器和研發創新獨立風道設計,散熱方案支持CPU功效提升45%;基於增強的可靠性、可用性和可服務性(RAS)技術,可多維度全覆蓋故障診斷、精細化定位等問題明確故障,使宕機率減少50%。

那麼,騰訊為什麼要做自研伺服器?

騰訊雲伺服器與供應鏈管理部總經理劉裕勳強調,騰訊做硬體從來不會單純的跟風,而是結合自己的實際情況做演進。騰訊伺服器從零到超百萬臺,二十年時間可分為三個時期,2000年到2010年階段的PC網際網路階段,2010年到2016年的移動網際網路階段,以及2016到現在的雲時代。

不同時期的業務矛盾特點不一樣,早期以QQ業務為核心,業務類型比較單一,依靠伺服器的增加就能解決;到了移動網際網路時代,騰訊開始爆發式增長,社交、遊戲、視頻、微信等內容產品快速崛起,不同業務架構複雜,催生了硬體定製化需求,如存儲伺服器等。

「現在騰訊走上了自研伺服器的道路,內部架構會逐步趨同,趨同的情況下我們有更好的辦法做更通用的硬體定製,我們要考慮更好的性價比和更穩定的質量。這是騰訊做伺服器的初衷。」劉裕勳說道。

騰訊運營管理部總經理陳鐵鋼也表示,過去伺服器的研發周期長達一年左右,騰訊將所有業務架構的團隊和伺服器團隊集中在一起進行評測,軟體團隊和硬體團隊協同,找到最佳適配的平衡點,從而大大縮短了伺服器的研發時間。

「單純依靠硬體不能滿足業務所有負載,比如高密度伺服器的存儲I/O能力會成為業務瓶頸,騰訊通過提供PaaS平臺解決了這個問題,用戶雖然感知不到,但是已經在享受軟硬一體帶來的好處。」陳鐵鋼說。

軟硬一體,騰訊補充全局版圖

「2018年『930』變革之後,開源協同和自研上雲就成為了騰訊未來在技術演進上面大的戰略調整。通過自有業務,比如微信、QQ、廣告、大數據等等海量規模業務上雲,不斷打磨騰訊雲的PaaS和IaaS層面能力,來真正的做到軟硬一體化協同。」劉裕勳介紹。

真正的軟硬一體協同,當然不是只有伺服器。騰訊式軟硬一體,是以全新自研伺服器產品為核心,圍繞網絡、存儲和運維等細分領域提供多樣解決方案,打造面向下一代的雲計算基礎設施。

「雲計算客戶都希望採用低成本、高質量的產品,客戶的需求推動我們去做更多的變革和演進。基礎設施領域不僅是伺服器,還包括數據中心和網絡等,騰訊正在系統性推進整體布局,得益於騰訊的技術變革,在這樣的戰略轉變下大家能夠更好的合作,這也是騰訊能夠把基礎設施做得很好的一種方式。」陳鐵鋼表示。

比如雲網絡面臨著性能壓力、運維壓力和可運維性方面的挑戰,對此,騰訊雲通過可編程晶片硬體的解決方案使得網絡帶寬提升的同時,成本縮減約為原來的三十分之一。

傳統網關升級通過冷升級的方式,依賴上聯交換機的hash能力和underlay網絡路由收斂時間,而騰訊雲可編程晶片硬體解決方案通過單節點熱升級的方式,onl控制面把配置按照數據面格式固化在內存存,利用tonfino dma控制器,升級後reload配置,整個熱升級過程可以控制在20ms之內。

而在網絡存儲虛擬化軟硬協同方面,騰訊雲推出了下一代容器網絡方案。該方案可無縫的支持和存量的雲主機進行相互熱遷移,能快速進行雲主機和容器服務部署,並且依託軟硬體協同實現的高密度彈性網卡,支持一個 Pod 獨佔一張彈性網卡,不再經過節點網絡協議棧(default namespace),極大縮短了容器訪問鏈路,縮短了訪問時延,並使 PPS 可以達到整機上限。

在存儲方面,硬碟容量越來越大,故障率和故障恢復時長也隨之變長,這會對雲上開發帶來很大的穩定性挑戰。為了給開發者提供更為穩健的雲服務,騰訊雲通過對硬碟來料質量,運營監控和技術創新等手段進行智能化運營。

騰訊雲伺服器運營中心專家工程師牛犇介紹,在來料質量方面,騰訊雲採取基於業務模型的來料篩選機制,通過雲業務模型與硬碟底層參數建模,分析參數統計分布,定製化篩選標準,使得硬碟年化故障率顯著降低至1/5。在運營監控方面,騰訊雲的硬碟智能監控系統通過多維度硬碟健康評分和AI故障預測,可使硬碟故障提前識別率提升至80%。

據騰訊統計,硬體故障導致的系統宕機中,內存故障佔比排第一。騰訊雲通過優化算法進行內存篩選、優選X4顆粒內存條、使能多種內存RAS特性等方式大大提升了伺服器的可靠性。此外,騰訊雲也是業內首家在雲計算領域大規模研發部署MCA Recovery技術的雲服務商,該技術能夠減少40%以上內存故障導致的宕機。

星星海,騰訊ToB必由之路

雲計算行業新的黃金十年,也是普惠發展的十年。新基建、數字經濟、新冠疫情等一系列因素推動雲計算行業競爭愈發激烈,尤其超大規模數據中心的崛起,業務需求倒逼伺服器等產品升級,依靠上一形態的產業鏈分工,已經無法全部滿足當下的客戶需求。

星星海硬體實驗室是騰訊首個硬體工程實驗室,該實驗室專注於硬體系統架構設計和前瞻性基礎技術研究,目前騰訊雲星星海已經發布了多款自研硬體產品,包括四款自研伺服器和一款智能網卡,並且在計算、存儲、網絡等全線硬體產品領域申請超過20多項專利。

星星海,取名自青海省果洛藏族自治州瑪多星星海,以水為名,取靈動與智慧之意,頗有網際網路快速創新的意味。

騰訊是全球最大的幾家CSP(內容服務提供商)之一,伺服器保有量規模過百萬,天然有著業務場景的沃土,可以持續不斷的迭代其底層基礎設施,隨著騰訊從CSP轉型雲服務商,這些自研能力自然而然對外輸出。

據了解,騰訊目前在新增伺服器中自研比例達到10-15%,未來騰訊雲和騰訊業務對自研伺服器的需求將加快提升。

雲計算承載的業務規模呈現指數級增長,哪怕萬分之一的成本降低或者效率提高,放到騰訊業務上都是肉眼可見的收益,騰訊雲給千行百業帶來的收益更是無法測算。

可以確定的是,未來雲計算的軟硬體一體化技術會進一步發展,企業用戶呼喚更健壯的雲基礎設施平臺,軟硬一體在性能、資源利用率等方面仍有上升潛力。

「雲基礎架構的複雜度對伺服器的質量要求會越來越高,通用伺服器的質量管控無法很好滿足。不論是部件和整機系統的匹配,還有上層軟體的適配,勢必需要騰訊和騰訊雲的團隊,在更加理解底層整機系統包和新興技術協同的基礎上做文章,騰訊不是為做硬體而做硬體,而是騰訊演進過程中必須要走的那一步。」劉裕勳肯定地表示。

海量雲時代,誰能為客戶提供更加穩定、更具性價比的服務,也就意味著獲得了雲計算馬拉松的身位優勢,騰訊雲已行至中途。

相關焦點

  • 雲計算基礎設施軟硬一體化,騰訊雲如何「舊路新走」?
    雲計算歷史性發展的背後,是一部產業變遷史。IT基礎設施從主機時代的集中,到PC時代的離散,雲計算的興起,再一次將IT基礎設施集中化,IT產業似乎也在遵循著「否定之否定」的鐘擺定理。隨著算力趨於集中,雲計算基礎設施也在經歷新一輪的變化。軟硬一體,一個不甚新鮮的詞彙,在不同時代卻有不同的內涵,雲計算時代的軟硬一體如何演進?
  • 騰訊雲星星海重磅發布兩款自研新品 打造軟硬一體雲計算基礎設施...
    (騰訊雲網絡產品中心研發副總監王亮)以全新自研伺服器產品為核心,圍繞網絡、存儲和運維等細分領域提供多樣解決方案,騰訊雲正通過軟硬一體化的方式,打造面向下一代的雲計算基礎設施,為各行各業提供更優質的雲計算服務,促進全社會的數位化轉型升級。
  • 騰訊雲星星海重磅發布兩款自研新品 打造軟硬一體雲計算基礎設施
    12月20日,在騰訊2020 Techo Park開發者大會「下一代軟硬一體化的雲計算基礎設施」分論壇上,騰訊雲重磅發布星星海首款自研GPU伺服器和星星海新一代自研雙路伺服器,後者也是國內首款搭載即將發布的第三代英特爾至強可擴展處理器(Ice Lake)的雙路伺服器。
  • 阿里雲飛天洛神2.0:高性能網絡軟硬一體化技術實踐
    雲網絡架構雲計算從9年前被質疑為新瓶裝舊酒,到經過多年的高速發展,正在成為水電煤一樣的基礎設施。雲網絡構建在物理網絡之上,為雲計算提供靈動、智能的網絡連接。雲網絡的性能和穩定性是雲計算的基石。VPC是雲網絡的基礎,VPC的基礎組件主要包括2部分:Gateway,vSwitch。
  • 順應雲計算變革大勢,騰訊雲全新星星海自研伺服器真正為雲而生
    從雲計算到雲原生,雲計算的加速進化正在給底層計算帶來新需求。今年以來,受疫情影響和新基建的不斷加速推進,越來越多的企業開始選擇上雲,基於雲的各種新產業、新業態、新模式全面爆發。據了解,星星海實驗室專注於硬體系統架構設計和前瞻性基礎技術研究,致力於通過創新性的高兼容架構,簡潔可靠的自主設計,結合騰訊自有業務以及雲上數百萬客戶的需求特性,為雲計算時代提供安全穩定、性能領先的基礎設施產品和服務。
  • 騰訊雲星星海重磅發布首款自研GPU伺服器 佔據業界幾宗「最」
    12月20日,在騰訊2020 Techo Park開發者大會「下一代軟硬一體化的雲計算基礎設施」分論壇上,騰訊雲重磅發布星星海首款自研GPU伺服器和星星海新一代自研雙路伺服器,後者也是國內首款搭載即將發布的第三代英特爾至強可擴展處理器(Ice Lake)的雙路伺服器。此外,騰訊雲還分享了在雲計算、存儲、網絡、運維在軟硬一體化趨勢下的創新和實踐。
  • 如何確保雲計算基礎設施的安全
    打開APP 如何確保雲計算基礎設施的安全 51cto 發表於 2020-12-02 16:03:11   對於任何將工作負載和應用程式遷移到雲的組織而言,最重要的考慮因素之一就是確保其所基於的雲計算基礎設施是安全的。
  • 騰訊雲星星海發布首款自研GPU伺服器和新一代自研雙路伺服器
    2020 年新冠肺炎 「黑天鵝事件」 肆虐全球,出於疫情防控的需要,以往發生在線下的面對面的諸多工作與生活場景不得不轉移到線上,催生或者說加速了雲會議、雲打卡、雲診斷、雲教學、雲遊戲、雲監工等一系列新型 「宅經濟」 的蓬勃發展,從真正意義上掀開了萬物雲化與全民用雲時代來臨的大幕。
  • 雲計算驅動新零售精益增長,領鳥雲助力愛秒贊
    阿里巴巴新掌門張勇曾在烏鎮網際網路大會上談到,數字經濟的發展是中國巨大的機會,是中國的市場經濟發展的巨大機會,而走向數字經濟的最佳路徑是通過雲計算賦能傳統經濟,讓傳統經濟通過雲技術實現數位化,智能化。  新零售時代下,面臨零售場所和消費觀念的轉變,傳統零售需要重新整合和重組。而雲計算在其中又將扮演什麼樣的角色。
  • 騰訊雲首發雲原生線路圖 王慧星稱將加大基礎設施投入和自研創新力度
    原標題:騰訊雲首發雲原生線路圖,王慧星稱將加大基礎設施投入和自研創新力度    隨著數位化滲透率的逐年提升,不管是傳統
  • 騰訊雲與英國工業軟體公司AVEVA達成合作 攜手加速工業數位化轉型
    來源:證券時報記者5月13日從騰訊了解到,騰訊雲與國際知名工業軟體公司AVEVA籤署框架合作協議。騰訊雲作為各行各業升級的數位化助手,擁有業界領先的雲計算、雲數據、雲運營等一體化雲端服務能力,以及AI、大數據、區塊鏈等技術優勢,能夠為AVEVA軟體部署和運維提供高效可靠的雲技術平臺。成熟、完整的方案結合領先的技術實力,形成了一套可行、可靠、可持續的數位化升級解決方案。
  • 雲計算新巴別塔,百度雲的答案是AI
    和幾年前新興業務的身份不同,處於風暴中心的雲計算,早已成為網際網路巨頭和創業者們最激烈的戰場,並相繼宣布了醞釀許久的動作。阿里在財報中努力擴大雲計算的佔比,並視之為新的增長引擎。騰訊的態度和阿里相似,感知到流量見頂的焦慮後,產業網際網路成為騰訊的下半場,雲計算正是轉型的起點。
  • 阿里雲、騰訊雲的新戰場:金融雲
    不過在阿里落下這一子時,老對手騰訊並非只是在閒著看熱鬧。螞蟻官宣上市計劃前10天,7月10日,騰訊雲和深圳證券通信有限公司召開線上發布會,正式發布合作建設的新一代金融雲,助力深交所集團、市場機構和監管機構金融科技創新。相比螞蟻謀求上市,騰訊雲和深證通合作建設新一代金融雲,向深交所提供服務,或許意義同樣重大。
  • 產業網際網路風起雲湧,雲計算格局或被重塑
    作為產業網際網路基礎設施的雲計算玩家,將成為第一波受益者,雲計算玩家都在變陣。12月21日,在UCloud用戶大會暨Think in Cloud(TIC)大會上海站上,其發布了包括UCloudStack新一代輕量級IaaS平臺在內的多個雲計算/大數據和AI產品,明確將為不同行業定製FSDI-CBA企業級一體化雲計算方案,UCloud認為:「隨著以流量為中心的消費網際網路
  • 騰訊雲總裁邱躍鵬:騰訊已經邁入「雙百時代」,但云計算仍有三道坎
    (觀察者網訊 文/燕妮)21日,在2019騰訊全球數字生態大會上,騰訊雲總裁邱躍鵬表示,騰訊目前已經邁入「雙百時代」,全網伺服器總數量突破100萬臺,帶寬峰值突破100T。騰訊是中國首家伺服器總量超過百萬的公司,也意味著騰訊的業務規模、承載的網絡流量都邁入了全球第一梯隊。
  • 騰訊雲王慧星:數位化技術給各行各業帶來變革
    中國經濟新聞網訊(記者 劉慧)「數位化技術正在給各行各業帶來巨大的變革,也給作為支撐的雲計算基礎設施提出更高的需要。」12月19日,在騰訊2020TechoPark開發者大會上,騰訊雲副總裁王慧星如此表示。
  • 英特爾聯合騰訊發布星星海新一代自研雙路伺服器
    Lake」)的騰訊雲星星海新一代自研雙路伺服器。 騰訊雲星星海新一代自研雙路伺服器發布 此次發布的騰訊雲星星海新一代自研雙路伺服器搭載兩顆即將發布的第三代英特爾至強可擴展處理器(代號「Ice
  • 愈來愈近的雲計算,愈來愈簡單的雲原生
    作者 | 葛覃雲計算行業總有新故事,卻又是IT發展史上相似的轉折。最初,雲計算被認為是集中化IT的重現,以至於有「新瓶裝舊酒」的行業論斷,經歷過十餘年左右的發展,雲計算補充了傳統企業分散式IT的不足,並且迎來了可持續的增長期,雲計算為主的IT模式正發展為主流。也許是時候重新審視雲計算「新瓶裝舊酒」的觀點。
  • 新基建時代,騰訊雲如何成為中小企業的好幫手?
    在此過程中,以騰訊云為代表的雲計算企業,憑藉強大的數據分析、存儲、高並發業務處理等能力,在金融行業未來發展中,發揮越來越重要的作用。而具有多重優勢的騰訊雲,已成為眾多行業及企業的選擇。未來,騰訊雲與貴港市還將以綜合金融服務平臺建設為起點,持續探索「政-金-產-數」新普惠金融模式,推動當地數字金融發展。
  • 二馬競逐中國雲計算:阿里遙遙領先,騰訊奮起直追
    目前,阿里巴巴是雲計算領域無可爭議的領導者。但IDC的數據顯示,騰訊正在不斷取得進步。在IaaS(Infrastructure as a Service,基礎設施即服務)領域,騰訊去年的市場份額達到11.5%。IaaS是中國最流行的雲服務形式之一。雖然騰訊目前的市場份額遠遠低於阿里雲的43%,但比2016年的7.4%有所改善。