騰訊雲星星海兩款自研新品亮相 打造軟硬一體雲計算基礎設施

2020-12-25 DOIT

12月20日,在騰訊2020 Techo Park開發者大會「下一代軟硬一體化的雲計算基礎設施」分論壇上,騰訊雲重磅發布星星海首款自研GPU伺服器和星星海新一代自研雙路伺服器,後者也是國內首款搭載即將發布的第三代英特爾至強可擴展處理器(Ice Lake)的雙路伺服器。此外,騰訊雲還分享了在雲計算、存儲、網絡、運維在軟硬一體化趨勢下的創新和實踐。

星星海首款自研GPU伺服器 

會上,騰訊雲伺服器與供應鏈管理部總經理劉裕勳表示,隨著雲計算承載的業務規模越來越大,傳統伺服器難以完全滿足雲計算數據中心場景下對超大規模、需求多樣、高性價比、安全可靠以及軟硬體一體化等方面的要求。通過軟硬一體化的不斷發展,騰訊雲可以結合開發者的多元化需求提供更高性能、更佳性價比的體驗。

此次,騰訊雲在深入理解業務需求的基礎上,重磅推出星星海首款自研GPU伺服器。

在雲遊戲場景中,客戶對單卡TCO,單用戶成本非常敏感,迫切需要降低成本。但現存所有GPU伺服器機箱長度過長,當遇到需要低延時邊緣部署時,無法滿足需求,會出現單卡掛死,導致整機掛死的情況。

針對類似的場景和業務需求,星星海首款自研GPU伺服器在性能、能效、安全特性、可靠性等層面進行了大膽的自主創新和突破。

在設計上,全球首創在同一框架內,靈活更換主板,支持多平臺兼容,使得業務在面對GPU 選擇時獲得非常充分的競爭優勢;同時結合業務對PCIe帶寬要求低的特點,支持16卡GPU+4路intel伺服器,達到業界最高密度,可大幅降低單卡TCO。

在創新上,創業界最短機框,支持邊緣部署,提高帶寬穩定性,極大降低業務延時(最高可降近百毫秒);在可用性上,這款GPU伺服器的RAS特性以及PCIe熱插拔特性,使得單GPU故障對整機無影響,可用性大幅度提升。

星星海新一代自研雙路伺服器,雲上建設提前享受技術紅利

隨著AI、5G、車聯網和物聯網等技術的大規模部署,企業對於算力、存儲等方面的要求也更加苛刻。星星海新一代自研雙路伺服器是國內首款搭載即將發布的第三代英特爾至強可擴展處理器(Ice Lake)的雙路伺服器,為用戶提供更高內存帶寬,更快I/O吞吐,更強實例性能,並幫助用戶基於英特爾深度學習加速(英特爾DL Boost)技術,獲得處理器內置AI加速能力。

星星海新一代自研雙路伺服器基於即將發布的第三代英特爾至強可擴展處理器,採用英特爾的10納米製程,能夠滿足通用計算、異構計算、裸金屬、高性能計算等全業務場景需求。測試數據顯示,與搭載第二代英特爾至強處理器的雙路伺服器相比,新款伺服器的浮點性能提高70%,同時單機最高支持的內存可達12TB,可充分滿足大型資料庫等業務需求。

經測試,星星海新一代自研雙路伺服器通過深度優化定製,計算密度提升50%;通過高性能散熱器和研發創新獨立風道設計,散熱方案支持CPU功效提升45%;基於增強的可靠性、可用性和可服務性(RAS)技術,可多維度全覆蓋故障診斷、精細化定位等問題明確故障,使宕機率減少50%。

面對雲業務的需求, 星星海新一代自研雙路伺服器大幅提升騰訊雲計算矩陣戰略能力,為用戶提供更強的計算性能,實現彈性部署,有效降低雲服務總體成本。憑藉對硬體系統架構設計和前瞻性基礎技術研究,星星海新一代自研雙路伺服器可以支持未來3-5年的前瞻性架構演變,讓雲上開發部署提前享受技術紅利。

英特爾全球大客戶總監米琦表示:「英特爾將基於『以數據為中心』的全面產品組合、強大合作夥伴生態系統和持續不斷的技術創新構築堅實智慧雲基石,一如既往地攜手騰訊,共同加速智慧雲計算與新基建的發展,擁抱數字經濟。」

值得一提的是,這兩款伺服器都是出自星星海硬體實驗室,也是騰訊首個硬體工程實驗室,該實驗室專注於硬體系統架構設計和前瞻性基礎技術研究。目前騰訊雲星星海已經發布了多款自研硬體產品,包括四款自研伺服器和一款智能網卡,並且在計算、存儲、網絡等全線硬體產品領域申請超過20多項專利。

軟硬一體化成趨勢,騰訊雲打造雲計算基礎設施

在數據大爆發的時代背景下,雲計算承載的業務規模呈現指數級增長,軟體和硬體的結合成為剛需。未來,軟硬體一體化技術會進一步發展,為用戶提供更強壯的基礎設施平臺,提升雲計算的性能、提高資源利用率,最終為用戶提供穩定、更具性價比的服務。

此次分論壇上,除了發布兩款全新伺服器自研硬體產品,在雲計算軟硬一體化的大趨勢下,騰訊雲還重點分享了在存儲、網絡和運維等方面的具體實踐,為業界提供了更多的參考。

隨著磁存儲技術和工藝製程的發展,硬碟容量越來越大,故障率和故障恢復時長也隨之變長,這會對雲上開發帶來很大的穩定性挑戰。為了給開發者提供更為穩健的雲服務,騰訊雲通過對硬碟來料質量,運營監控和技術創新等手段進行智能化運營。

騰訊雲伺服器運營中心專家工程師牛犇介紹,在來料質量方面,騰訊雲採取基於業務模型的來料篩選機制,通過雲業務模型與硬碟底層參數建模,分析參數統計分布,定製化篩選標準,使得硬碟年化故障率顯著降低至1/5。在運營監控方面,騰訊雲的硬碟智能監控系統通過多維度硬碟健康評分和AI 故障預測,可使硬碟故障提前識別率提升至80%。

目前,騰訊數據中心正在運行的伺服器超過100萬臺,經統計,硬體故障導致的系統宕機中,內存故障佔比排第一。騰訊雲星星海實驗室副總監李志高認為,解決數據中心伺服器宕機率高的關鍵路徑是降低內存故障率和減少內存故障導致的宕機。

騰訊雲通過優化算法進行內存篩選、優選X4顆粒內存條、使能多種內存RAS特性等方式大大提升了伺服器的可靠性。此外,騰訊雲也是業內首家在雲計算領域大規模研發部署MCA Recovery技術的雲服務商,該技術能夠有效緩解不可糾正錯誤的影響,減少40%以上內存故障導致的宕機。

騰訊雲的規模正在飛速發展,雲網絡內部網關及邊界網關帶寬性能需求也伴隨著騰訊雲的規模在快速提升,雲網絡面臨著性能壓力、運維壓力和可運維性方面的挑戰。為此,騰訊雲通過可編程晶片硬體的解決方案使得網絡帶寬提升的同時,成本縮減約為原來的三十分之一。

傳統網關升級通過冷升級的方式,依賴上聯交換機的hash能力和underlay網絡路由收斂時間,而騰訊雲可編程晶片硬體解決方案通過單節點熱升級的方式,onl控制面把配置按照數據面格式固化在內存存,利用tonfino dma控制器,升級後reload配置,整個熱升級過程可以控制在20ms之內。

騰訊雲網絡產品中心專家工程師陳曦表示,目前該項解決方案已經應用在騰訊雲多個高性能的業務場景之中,除了騰訊內部業務大量上雲之外,也即將應用在用戶idc和本地專有雲互通、用戶idc數據遷移上雲等。

而在網絡存儲虛擬化軟硬協同方面,搭配騰訊雲自研智能網卡能實現雲主機鏡像(公有鏡像,自定義鏡像)全兼容,兼容現有騰訊云云主機各類鏡像包括linux和windows。騰訊雲容器服務 TKE 藉助智能網卡推出下一代容器網絡方案。

據騰訊雲網絡產品中心研發副總監王亮介紹,該方案可無縫的支持和存量的雲主機進行相互熱遷移,能快速進行雲主機和容器服務部署,並且依託軟硬體協同實現的高密度彈性網卡,支持一個 Pod 獨佔一張彈性網卡,不再經過節點網絡協議棧(default namespace),極大縮短了容器訪問鏈路,縮短了訪問時延,並使 PPS 可以達到整機上限。除此之外,方案還實現了短連結場景下 QPS 相比之前容器網絡方案(策略路由方案,網橋方案)提升 50%-70%;長連結場景下 QPS 提升 40%-60%。

以全新自研伺服器產品為核心,圍繞網絡、存儲和運維等細分領域提供多樣解決方案,騰訊雲正通過軟硬一體化的方式,打造面向下一代的雲計算基礎設施,為各行各業提供更優質的雲計算服務,促進全社會的數位化轉型升級。

未經允許不得轉載:DOIT » 騰訊雲星星海兩款自研新品亮相 打造軟硬一體雲計算基礎設施

相關焦點

  • 騰訊雲星星海重磅發布兩款自研新品 打造軟硬一體雲計算基礎設施
    12月20日,在騰訊2020 Techo Park開發者大會「下一代軟硬一體化的雲計算基礎設施」分論壇上,騰訊雲重磅發布星星海首款自研GPU伺服器和星星海新一代自研雙路伺服器,後者也是國內首款搭載即將發布的第三代英特爾至強可擴展處理器(Ice Lake)的雙路伺服器。此外,騰訊雲還分享了在雲計算、存儲、網絡、運維在軟硬一體化趨勢下的創新和實踐。
  • 雲計算基礎設施軟硬一體化,騰訊雲如何「舊路新走」?
    雲計算歷史性發展的背後,是一部產業變遷史。IT基礎設施從主機時代的集中,到PC時代的離散,雲計算的興起,再一次將IT基礎設施集中化,IT產業似乎也在遵循著「否定之否定」的鐘擺定理。隨著算力趨於集中,雲計算基礎設施也在經歷新一輪的變化。軟硬一體,一個不甚新鮮的詞彙,在不同時代卻有不同的內涵,雲計算時代的軟硬一體如何演進?
  • 騰訊雲光博會發布兩款自研光網絡新品,打通數據中心高速通路
    剛剛獲悉,騰訊雲在第22屆中國國際光電博覽會(CIOE)上正式發布兩款重量級自研光網絡產品。其中,OPC-4平臺的CMUX-64成為目前業內首款64通道支持靈活柵格(Flex-grid)能力的光層業務單板;而TPC-4平臺的T2X4C8則成為業內第一款基於400G可插拔CFP2-DCO的電層業務單板。
  • 英特爾聯合騰訊發布基於下一代至強可擴展處理器的星星海新一代...
    英特爾至強可擴展處理器(代號「Ice Lake」)的騰訊雲星星海新一代自研雙路該款伺服器同時也是雙方聯合發布的第二款伺服器產品,於此前發布的騰訊雲星星海首款自研四路伺服器將於本月底正式加入騰訊雲產品矩陣,為行業終端
  • 透過騰訊雲,窺探神秘的全真網際網路
    王慧星稱,根據云計算的摩爾定律,雲計算提供的計算、網絡、存儲算力每隔18個月就翻一倍,因此,這也需要騰訊持續加大基礎設施投入規模和自研技術創新力度。 目前,騰訊雲已上線多個沉浸式媒體解決方案,包括VR視頻解決方案、騰訊臨境沉浸式解決方案等。 軟硬一體成為趨勢 對於未來技術的發展,王慧星還向記者表示,基礎設施的軟硬一體化將是大勢所趨,而這,也是騰訊開始發力自研硬體產品的根本原因。
  • 騰訊雲全新升級第五代算力矩陣
    自主創新是雲計算的核心生命力,軟硬體協同發展是雲計算未來的發展趨勢。騰訊雲計算產品總經理沙開波表示,隨著企業數位化轉型的深入,對算力的要求越來越高,騰訊雲通過自研戰略推進軟硬體協同進而提升算力,不斷豐富計算能力產品和輸出方式,幫助客戶更好地實現數位化轉型。
  • 又一款星星海伺服器問世的背後,英特爾和騰訊雲有緊密合作
    這是2020年12月20日,Techo Park騰訊開發者大會上,騰訊雲與英特爾聯合發布騰訊雲星星海新一代自研雙路伺服器時,作為騰訊雲伺服器供應鏈總經理的劉裕勳的感受。騰訊雲星星海新一代自研雙路伺服器發布2020年春節,這次準備的資源發揮了比以往都更重要的作用,面對疫情,復工復產的壓力很快就讓線上業務流量激增,例如遊戲和視頻影音類服務,特別是騰訊會議的業務量也迎來暴漲,對此,騰訊雲利用8天時間就擴容了驚人的
  • 雲計算正在定義硬體
    說這句話的是騰訊雲伺服器與供應鏈管理部總經理劉裕勳,實際上,隨著雲計算產業的發展,從技術的角度說,雲計算已經超過IT基礎設施的範疇,正向上定義軟體應用服務,向下定義晶片、伺服器等IT硬體。在劉裕勳看來,隨著雲原生理念的不斷推進,雲基礎架構的演進過程中會呈現出三個特點:高複雜度、高性價比、安全性。
  • 騰訊雲副總裁王慧星:持續加大基礎設施投入規模和自研創新力度
    12月19日,在騰訊2020 Techo Park開發者大會上,騰訊雲副總裁王慧星表示,數位化技術正在給各行各業帶來巨大的變革,但同時也給作為支撐的雲計算基礎設施提出更高的需求。騰訊雲將圍繞成本、安全、創新、工具,以及智能等維度,持續加大基礎設施投入規模和自研技術創新力度,通過構建雲、邊、端一體化產品和服務體系,為千百萬開發者一站式提供設計、開發、測試、運維完整產品矩陣,助力開發者提升效率,快速上雲。隨著數位化滲透率的逐年提升,不管是傳統產業還是新興產業都正在加快數位化步伐,數位化技術也越來越成為疫情之下支撐經濟發展的重要力量之一。
  • 「金牌」英特爾加持 助企業打造千變萬化的雲
    以數據為中心的智能世界對IT基礎架構的現代化提出了新需求,雲計算、AI、5G等新技術的普惠使得智能化場景在各行各業逐級縱深。更重要的是,在新基建的大趨勢之下,信息基礎設施、融合基礎設施、創新基礎設施的發展理念不僅為信息技術的創新奠定了堅實基礎,還加速著行業應用與技術實踐的深度融合,並以此構築了長期可持續的產業生態。
  • 自研晶片亮相 蘋果與英特爾正式分手
    M1晶片「上位」醞釀多時,蘋果自研晶片終於亮相。當地時間11月10日,在今年的最後一場新品發布會上,蘋果推出了首款為Mac電腦打造的晶片M1。它將取代自2005年起就用於Mac的英特爾晶片,這也意味著蘋果與英特爾長達15年的合作畫上了句號。
  • 從IaaS到SaaS,騰訊二十年自研技術雲上集結
    9月11日,在2020騰訊全球數字生態大會原生技術專場,騰訊雲就集中展示了在新基建和數位化轉型領域多年來的自研技術積澱與產品服務,從自研伺服器到自研數據中心,再到自研雲端軟體,揭開了騰訊雲技術自研領域的全景圖。未來,依託大量的技術積累與海量用戶服務經驗,騰訊雲也將繼續加速構建自研技術體系,為各行各業提供更優質的雲計算服務。
  • 三大關鍵詞催生雲上業務井噴,騰訊雲資料庫最新布局率先亮相
    此外,新基建戰略的加速無疑也將推動5G、雲計算、大數據等IT基礎設施的跨越式發展,在此背景下數據量將出現指數級的增長,對未來在線交易以及在線分析的數據性能需求也將進一步提升。同時,數據多模的業務需求以及場景、部署的業務融合也將更加多樣化,數據自動化治理趨勢愈發明顯。王義成強調,資料庫自治的優化將成為未來決定資料庫行業發展的一個重要業務走向。
  • 騰訊雲資料庫發布五大資料庫新品
    中國財富網訊(董和佳)據中國證券報·中證網報導,8月28日,騰訊雲資料庫宣布未來將聚焦雲原生、自治、超融合三大戰略方向,並同步發布五大戰略級新品,包括資料庫智能管家DBbrain、雲資料庫TBase、資料庫備份服務DBS、雲資料庫Redis混合存儲版,以及自研雲原生資料庫CynosDB
  • 騰訊、惠普、英特爾打出組合拳,軟硬一體打造專業教育本
    在今年「雙十二購物狂歡節」中,騰訊聯合惠普、英特爾打造的惠普智能教育本上市,引起廣泛關注。今年的疫情環境,改變了用戶以往的學習習慣,線上線下相融合的學習模式已經形成。在此背景下,智能教育產品被迅速普及,教育裝備和教育課程等教育產品作為新興品類,因其專業、高效的特點,登陸各大電商平臺後,迅速成為當代家長們「搶購」的新寵。
  • 2020百度雲智峰會智能計算論壇:AI-Native打造AI新基建引擎
    「雲智一體」成百度智能雲獨特的競爭力,在各行各業加快規模化落地。在下午舉行的智能計算專題論壇上,百度集團副總裁侯震宇、百度智能雲副總經理謝廣軍等業務負責人出席並分享了百度AI-Native雲計算架構及產品方案矩陣,還發布和升級了包含百度太行彈性高性能計算實例、ARM一體機在內的4大新品以及8大產品平臺解決方案。
  • Techo Park開發者大會正式揭幕,騰訊雲發布系列重磅新品和計劃
    包括面向全球開發者,騰訊雲重磅發布的企業雲原生最佳實踐路線圖、SuperEdge 邊緣容器開源項目、八大雲原生系列新品、以及騰訊雲未來開發者雲梯計劃等,全面釋放雲計算價值,為企業上雲提供全方位支持。騰訊雲副總裁王慧星表示:「數位化技術正在給各行各業帶來巨大的變革,但同時也給作為支撐的雲計算基礎設施提出更高的需求。
  • 騰訊雲發布5款資料庫,產品布局趨完整
    北京時間8月23日消息,騰訊雲對外發布資料庫CDB產品矩陣,並更新發布5款資料庫產品,包括新一代雲資料庫MySQL、雲資料庫HBase、雲資料庫PostgreSQL、分布式資料庫TDSQL、SQLServer2012,以上新品或突破原有產品的性能,或填補雲資料庫領域空白,全面豐富企業使用雲資料庫的選擇
  • YOGA 27多功能一體電腦亮相 聯想舉行消費秋季新品發布會
    其中,聯想旗下YOGA品牌發布了YOGA 14s 2021、YOGA 14c 2021、YOGA 13s 2021、YOGA Pro 13s Carbon 2021四款筆記本新品和YOGA 27多功能一體電腦;聯想旗下小新品牌發布了小新Pro 14 2021、小新Air 14 2021兩款筆記本新品,以及聯想小新Pad Pro和小新Pad兩款平板;此外,聯想個人云存儲X1也首次登臺亮相。
  • 達摩院預測全球IT產業新格局:雲計算登上舞臺中央
    率先推出雲計算的是亞馬遜與阿里巴巴兩大電商巨頭,這是因為電商企業在不同時段的交易量存在巨大差異,造成企業在交易高峰時往往算力不足,在交易低谷時的算力存在較大富餘,這就推動二者開始嘗試通過大規模分布式的技術架構,實現跨數據中心的資源管理和調度,也就是雲計算的雛形。