騰訊與清華大學產學研協同創新 推進新基建數據中心智能化發展

2020-09-14 數據中心世界

近日,騰訊數據中心與清華大學自動化系智網中心團隊的賈慶山老師合作論文被第21屆IFAC國際自動控制世界大會錄取。該大會為自動控制領域三大頂會之一,將於今年7月在德國柏林舉辦。本屆大會將關注可持續資源、綠色能源、數位化和工業4.0等主題,人工智慧、控制和計算機科學日益重要的融合也將成為大會關注的焦點。

此次騰訊聯合團隊投中的論文全稱為Predictive Maintenance of VRLA Batteries in UPS towards Reliable Data Centers (中文名稱:對可靠數據中心UPS使用的VRLA電池的預測性維護)。

據介紹,論文提出的電池故障檢測方法,填補了此前行業針對UPS(Uninterruptible Power System,不間斷電源)電池基於數據驅動的預測性維護的研究空白,相比當前基於專家經驗和閾值規則等進行判斷的檢測方式有更高的準確率,同時可以提前預警電池健康狀態,有效提升數據中心的智能管理水平,是人工智慧技術在數據中心落地應用的生動實例。

據了解,該研究成果也已經整合形成電池AI診斷服務,搭載在騰訊自研的數據中心智能運維平臺——騰訊智維上,成功支撐了騰訊深汕數據中心的電池健康管理服務交付工作,目前已覆蓋了騰訊自建數據中心的數萬隻蓄電池。未來,將全面覆蓋騰訊數據中心的幾十萬節電池,並面向廣大行業夥伴開放。

通過人工智慧對數據中心蓄電池進行預測性維護

UPS供電系統是滿足數據中心供電質量的核心部分,而蓄電池又是UPS系統中最重要的組成之一,是整個供電系統的「最後一道屏障」,在UPS系統的故障中,與蓄電池有關的原因佔30%以上。如果電池故障引起UPS系統宕機,關鍵業務中斷,將產生很大的經濟損失。行業調查機構顯示:金融行業的數據中心每宕機一小時的損失為1495134美元,通訊行業的數據中心每宕機一小時的損失為2066245美元。因此通過對蓄電池系統科學的運維管理、監測維護,及時發現故障隱患並及時維護更換,將極大提升數據中心持續運轉的可靠性。

不間斷電源系統使用的蓄電池

面對數據中心成千上萬的蓄電池,通過人工智慧自動化的方式進行檢測和維護能極大提升效率。但現實中,AI在蓄電池故障預測的落地並不容易。首先,由於日常狀態UPS中使用的蓄電池通常在浮充狀態下運行,因此監控數據的信息量遠不及進行放電測試所收集的數據。第二,沒有統一的電池更換標準,現有的維護策略依賴於專家知識。第三,電池故障相關的數據量不足,使尋找高質量模型的任務具有挑戰性。


此前行業關於用數據驅動電池壽命預測的研究,也多關注於電動汽車電池這類可循環使用的電池,針對UPS類等常態處於浮充狀態電池的健康管理,此前未見已有研究。


針對這些問題,騰訊清華聯合團隊依託於騰訊智維平臺提供的海量數據中心運營數據,研究了一種用於UPS中VRLA電池的預測維護的新型數據驅動技術。據介紹,為了提高數據採集和標註的效率,團隊首先對電池自然老化和內部急劇衰退兩種情況,提出了一種可以自動標註電池退化時間點的算法,分別以電池內阻和電壓離群程度進行自動標註,避免了數據標註過程中的重複和繁重的體力勞動。然後,針對蓄電池監控數據數據量大、數據維度低的問題,應用特徵工程技術對數據維度進行擴展。在完成特徵工程後,研究人員分別訓練了邏輯回歸、隨機森林、梯度提升決策樹和人工神經網絡模型,對蓄電池是否發生故障進行預測。實驗結果表明,AI模型對故障電池的預測準確率為98%,和現有的基於閾值的判斷規則相比,AI模型平均能夠提前15天預測電池的故障。

目前上述研究成果已經被研究團隊整合形成電池AI診斷服務,並在騰訊自研的數據中心基礎設施管理軟體平臺——騰訊智維平臺上發布落地,覆蓋了騰訊自建數據中心的數萬隻蓄電池。該服務能夠方便地集成進現有的電池管理服務中,並能夠自動對採集到的蓄電池電壓、內阻和溫度數據進行分析預測。

應用數據驅動進行UPS蓄電池健康管理流程圖

現場專家工程師對AI故障診斷的效果進行了持續的跟進驗證,驗證結果表明,相比於原有的電池維護策略,AI診斷服務能夠更加準確地對電池的故障狀態進行提前預測,同時還可以檢測出超出專家知識範圍的潛在電池故障,這使得數據中心的運維工程師能夠對蓄電池的維護更換進行更加有針對性地規劃,有效提高了蓄電池的運維效率,進一步保障數據中心的可靠性。在對騰訊天津數據中心3號樓的6880節電池進行現場實際落地驗證發現,電池健康管理服務可以實現96.2%的告警準確率,且告警時間比實際故障提前5~30天,大大優於傳統的基於經驗規則的分析方案。

目前,騰訊團隊正在逐步擴大落地範圍,未來將通過智維平臺,實現對騰訊幾十萬節電池的業務覆蓋。

據了解,騰訊智維平臺由服務騰訊內部的星雲平臺升級而來,是騰訊將近20年數據中心運營經驗與智能化、雲化技術相結合,自研的一款數據中心基礎設施管理軟體平臺。通過騰訊智維平臺,可以實現數據中心的智能告警、智能巡檢、智能容量分析和透明化的客戶體驗,為全局把控、精細化管理、優化運營成本提供基礎,同時也為技術專家實時、異地處理告警和數據中心的無人值守創造可能。它可以幫助客戶360°掌握數據中心的運行情況,持續提升運營的質量與效率,降低成本投入,將數據中心的價值極大化。騰訊智維平臺就像是數據中心的「大腦」,為騰訊數據中心賦予了精密的感知能力和快速迭代進化的能力。

騰訊智維平臺功能簡介

目前,騰訊智維平臺已在騰訊超過80個大規模數據中心進行部署,覆蓋了全球12個國家和地區,運營管理了超過100萬臺伺服器,測點數量超過600萬個。同時,騰訊智維也和重慶電信、廣東電信等運營商和銀行、證券等各行業的客戶達成了合作關係。據了解,騰訊智維平臺接入部署後,為重慶電信在能耗優化方面提升30%左右,每年節省電費達百萬元以上。

騰訊聯合高校攜手推進新基建領域技術創新及應用落地

早在2006年,騰訊就圍繞人才培養、聯合研究和學術交流三條主線啟動了騰訊高校合作項⽬,並先後與清華大學、哈爾濱工業大學、中科院計算所、北京大學、華中科技大學、中國人民大學、南京大學、西安交通大學等多所知名高校成立聯合實驗室,且與眾多領域專家開展產學研合作。

騰訊數據中心實地勘察研討交流

2016年,騰訊IDC平臺部與清華大學自動化系智網中心團隊的趙千川、賈慶山和夏俐老師建立了數據中心自動化運維領域的產學研合作。研究工作以提升數據中心運營質量、降低運營成本和提升運營效率三個目標為出發點,經過雙方多年持續耕耘,已累積發表6篇高質量學術論文,輸出7項發明專利。

騰訊數據中心和高校專業研究團隊的合作研究,不僅集中在電池健康管理的研究上。在數據中心智能告警方面,研究團隊提出了告警預警多維分析方案,綜合設備狀態、設備工藝,採用多傳感器融合以及專家知識等方法,通過對數據中心的告警數據的根因分析和關聯性分析,對數據中心告警風暴進行收斂,有效減少冗餘告警信息,實現了對數據中心設備的準確告警和提前預警,並在海量告警場景中進行告警溯源、定位根因,幫助現場工程師快速定位故障,有效提升現場告警的準確性和響應效率。該方案已應用於騰訊智維平臺,在近百個騰訊的數據中心中提供實際支持。

在數據中心節能方面,研究團隊採用AI技術,構建了數據中心能效預測模型,實現對數據中心能效的精準預測,並提供數據中心能效影響因子的解釋性服務,同時基於能效預測模型進行自動尋優的智能分析,輸出節能優化建議。該方案已在騰訊天津數據中心4號樓完成第一階段的落地驗證,實現良好的節能效果,證明AI技術在數據中心節能方面的應用價值和巨大潛力。

隨著相關研究的不斷深入,騰訊與清華將有更多研究成果在騰訊智維平臺上落地發布,推動平臺由自動化向智能化發展。

如今,數據中心智能化已成為其主要的發展方向,作為所有網際網路業務的基石,數據中心正在人工智慧技術的推動下發生著運維管理的大變革。作為世界領先的網際網路公司,也是全球IaaS市場增長最快的雲計算廠商之一,騰訊全網伺服器總量已經超過110萬臺,是中國首家伺服器總量超過百萬的公司,也是全球五家伺服器數量過百萬的公司之一。在此背景下,騰訊數據中心圍繞「降本增效」的核心訴求,不斷整合自身資源與經驗,加速構建基礎設施層的自研技術體系。

2020年3月4日,在中共中央政治局常務委員會召開的會議上,決策層強調,要加快推進國家規劃已明確的重大工程和基礎設施建設,其中5G 網絡、大數據中心、人工智慧等新型基礎設施建設成為備受關注的方向。人工智慧作為新一輪產業變革的核心驅動力,正在釋放歷次科技革命和產業變革積蓄的巨大能量,持續探索人工智慧技術在數據中心的應用,以人工智慧賦能數據中心,將極大地推動數據中心由自動化向智能化發展,也將促進數據中心快速適應新的智能化業務的需求。

延伸閱讀:

國際自動控制聯合會(IFAC,International Federation of Automatic Control)成立於1957年,是一個以國家組織為其成員的國際性學術組織,中國是創始國之一。該組織負責定期舉行控制方面的國際會議,方便控制領域的學者和工程師更好地進行學術交流。由其舉辦的IFAC世界大會(IFAC World Congress),於1960年起每三年召開一次,致力於反映世界範圍內控制理論與應用發展的新成果和趨勢,是自動控制領域公認的頂級學術會議。

相關焦點

  • 新基建 新引擎│福州:布局創新基建 讓「政產學研」協同發展
    《新基建 新引擎》系列報導,今天帶大家走進創新基建領域。福州新基建三年行動方案提出,將通過引進「大院大所大實驗室」,布局一批產業技術創新基礎設施,建設一批「政產學研」協同創新平臺,形成「多元引領,人才、技術、資本集聚」的創新基礎新生態。
  • 推進大數據智能化創新發展,科技創新中心建設「加速跑」
    8月18日,重慶市政府與北京大學籤署戰略合作協議,攜手共建北京大學重慶大數據研究院。此前,清華大學也加強與我市高校合作,支持重慶在智能技術與系統、寬帶通信、先進電子與光電子等領域的科研能力提升,助力重慶「雙一流」建設。像這樣的「大手筆」,近年來還有不少。推進大數據智能化創新發展,對加快西部(重慶)科學城建設、打造具有全國影響力的科技創新中心起到重要支撐作用。
  • 騰訊雲數據中心「全景圖」,做新基建的「基建」
    數字經濟的「溢出」,是以雲計算、大數據、人工智慧等新興技術所推動的產業創新,同時讓數據中心成為了科技創新和技術應用的實體,更成為了千行百業數位化轉型的「新基建」,為數字經濟發展提供了有力的支撐。今年初,數據中心被寫入「新基建」,數據中心產業也迎來了新一輪的快速增長。實際上,隨著雲計算的發展和網際網路崛起,數據中心產業已經歷了十幾年的成長。
  • 中國信通院ICT深度觀察報告會 新基建數據中心創新發展分論壇
    通信世界網消息(CWW)自2020年3月新基建政策發布以來,數據中心作為強力支撐各行業發展的關鍵基礎設施,迎來了創新與發展的新契機。「2021中國信通院ICT+深度觀察報告會」特設「新基建數據中心創新發展分論壇」,本次論壇主題為「綠色新基建 創新IDC」,由中國信息通信研究院(以下簡稱「中國信通院」)雲計算與大數據研究所與ODCC(開放數據中心委員會)具體承辦的此次論壇將帶來哪些亮點呢?亮點1:新思路、全方位、深剖析!
  • 亮點前瞻 | 中國信通院ICT深度觀察報告會 新基建數據中心創新發展分論壇
    自2020年3月新基建政策發布以來,數據中心作為強力支撐各行業發展的關鍵基礎設施,迎來了創新與發展的新契機。「2021中國信通院ICT+深度觀察報告會」特設「新基建數據中心創新發展分論壇」,本次論壇主題為「綠色新基建 創新IDC」,由中國信息通信研究院(以下簡稱「中國信通院」)雲計算與大數據研究所與ODCC(開放數據中心委員會)具體承辦的此次論壇將帶來哪些亮點呢?
  • 清華大學軟體學院院長王建民:以數字基建為契機,加強工業網際網路大...
    為響應中央決策部署,推進我國新型數字基礎設施建設,中國電子報特推出「推進數字基建·釋放經濟新動能」專欄,圍繞5G、數據中心、軟體定義基礎設施、工業網際網路等領域,邀請業內專家學者、企業家撰寫文章,從不同視角認識數字基礎設施的內涵和意義,準確把握我國數字基礎設施發展現狀、建設重點和推進路徑,並提出相關舉措建議。
  • 人民日報刊評:加速釋放新基建紅利 布局前瞻性創新基礎設施
    黨的十八大以來,信息基礎設施取得跨越式發展,融合基礎設施助推轉型升級的作用日益凸顯,創新基礎設施有力支撐了科學技術研究。可以說,我國新型基礎設施建設取得了明顯成效,對高質量發展的支撐作用正在加快釋放。面對經濟下行壓力加大、傳統基建投資邊際效益下降和產業滲透率下降的挑戰,我們必須加速推進新基建。這既是應對當前考驗的客觀需要,也是順應世界科技與產業變遷趨勢、打造未來發展新優勢的戰略抉擇。
  • 聚焦新基建,驅動新發展工業新基建(聊城)創新論壇在開發區舉行
    齊魯晚報 齊魯壹點 記者 張超 通訊員 黃廣鵬圍繞工業網際網路應用,聚焦製造智能化、信息化,有效助推實體經濟的高質量發展。6月5日,工業新基建(聊城)創新論壇在聊城經濟技術開發區智能光電信息產業園舉行。聊城經濟技術開發區黨工委副書記、管委會副主任於丙濤出席活動並致辭,其指出,聊城經濟技術開發區作為聊城產業發展、改革開放的前沿陣地,在市委、市政府的堅強領導下,一直堅持把厚植產業優勢、推進雙招雙引、加快新舊動能轉換作為高質量發展的戰略舉措。
  • 攜手教育部科技發展中心,華雲數據助推高校產學研創新基金「新一代...
    2019年5月19日,教育部科技發展中心高校產學研創新基金「新一代信息技術創新項目」項目啟動會議在武漢召開,華雲數據作為企業評委以及協辦單位受邀參會,助力評估各高校項目的可持續性和落地性,保證科技的最前沿和順利的驗收。
  • 白山:產學研協同創新謀發展
    公司經理助理文萍坦言:創新是企業發展的驅動力,而創新源於企業與各高校院所的完美「聯姻」。近年來,白山圍繞全市工業經濟發展需要,深化企業與省內外各高校院所的合作,建立產學研協同創新機制,出臺了《關於深化科技體制改革加快創新體系建設的實施意見》,制定了企業成果轉化獎勵辦法,激發企業創新發展的積極性,推進了一大批高新技術成果產業化。
  • 產業網際網路新基建,騰訊數據中心如何夯實時代「地基」?
    在新基建和產業網際網路兩股大潮加持下,數據中心將迎來發展的黃金十年。數據中心,顧名思義是數據集中處理、存儲、交換的物理空間,也是所有網際網路業務的基石。在大量業務需求的驅動下,數據中心行業正迎來一波新的建設高峰,但與此同時,數據中心重量不重質、舊技術落後於新業務需求、局部過熱等問題開始湧現。
  • 百應攜手杭州電子科技大學,驅動產學研創新戰略向縱深推進
    為深入貫徹省委省政府創新驅動發展戰略,推動產學研深度融合,百應科技攜手杭州電子科技大學建立戰略合作,打造「杭電-百應人工智慧聯合研發中心」,旨在充分發揮雙方優勢資源,共同推進前沿技術研究。,大力推進5G、大數據中心、工業網際網路等新一代數字基建。
  • 騰訊西部雲計算數據中心二期一半的項目規劃已建成
    「重慶正在大力發展大數據智能化,數據中心在這個過程中將發揮重要的支撐作用。」王川航說,數據中心是發展信息產業的基礎工程,騰訊西部雲計算數據中心二期建好後,能夠吸引到更多優質的網際網路企業落戶重慶、深耕兩江新區,為兩江新區引進資金、技術、管理等方面的人才,助力兩江新區實現高質量發展。
  • 「新基建」時代需要怎樣的數據中心?
    隨著我國「新基建」政策的推進,雲計算服務部署提速,相關設備及服務需求增加,數據中心作為底層基礎設施有望持續增長,數據中心建設及擴容的步伐也會相應加快。據最新發布的《2019-2020中國IDC產業發展研究報告》預計,2019-2022年中國IDC業務市場規模複合增長率為26.9%。那麼,在「新基建」背景下需要怎樣的數據中心?本期小編來為大家分析下。
  • 中金數據集團與江蘇電信達成合作共築「新基建」
    12月18日,主題為「聚力數據,互促共贏」的江蘇數據中心產業發展閉門研討會在江蘇省崑山市中金崑山數據中心隆重舉行。會議匯聚眾多業界技術專家與高級管理者,共同交流在「新基建」的大背景下,江蘇數據中心發展的新思路與路徑。
  • 共築數字新基建時代!一局發展與騰訊雲開啟戰略合作
    、智能建造、產業小鎮企業數位化升級等領域展開深入合作打造EPC+T(工程總承包+騰訊)創新業務模式共建產業數智新基建標杆助力實體產業經濟發展依託中建一局建設發展公司的EPC工程總承包能力,結合騰訊雲的信息技術能力,雙方將攜手在片區綜合開發、高科技工廠、大型公共建築等領域開展新基建類型項目,打造數字孿生「智慧園區」, 為智慧園區建設打造可複製、高可用的解決方案,共建全國頂級的示範性園區,推動數字產業創新發展。
  • 騰訊5000億元加碼新基建 數據中心概念股再度爆發!
    26日發行的信達澳銀科技創新基金一日售罄。擬任基金經理表示看好5G相關的基建、車聯網、物聯網、高清視頻,以及半導體領域。   聯播速遞   高層在出席解放軍和武警部隊代表團全體會議時強調,在疫情防控常態化前提下紮實推進軍隊各項工作,堅決實現國防和軍隊建設2020年目標任務。
  • 科技創新推進新基建發展的現狀與建議
    習近平總書記多次在中央會議上親自對新基建工作作出部署,指出「要抓住產業數位化、數字產業化賦予的機遇,加快5G網絡、數據中心等新型基礎設施建設,抓緊布局數字經濟、生命健康、新材料等戰略性新興產業、未來產業,大力推進科技創新,著力壯大新增長點、形成發展新動能」。科技部、國家發改委等部委積極貫徹落實中央有關精神,紛紛發文支持新型基礎設施建設。
  • 新基建發展的本質,就是計算力的發展
    由此而來的,就是我們如何利用計算力及其技術,比如雲計算、大數據、物聯網、人工智慧等等加速經濟的發展。軟硬協同釋放算力從3月4日,中共中央政治局常務委員會召開會議,提出新基建概念,在隨後的4月20日,國家發改委對新基建的定義也給出了明確的、權威的說法,其內容包括信息基礎設施、融合基礎設施和創新基礎設施三個方面。
  • 【特別策劃】如何加快推進湖北「新基建」?
    「新基建」是新型基礎設施建設的簡稱,它包含以5G、物聯網、工業網際網路、衛星網際網路為代表的通信網絡基礎設施,以人工智慧、雲計算、區塊鏈等為代表的新技術基礎設施,以數據中心、智能計算中心為代表的算力基礎設施;「新基建」深度應用網際網路、大數據、人工智慧等技術,支撐傳統基礎設施轉型升級,實現物理空間和網際網路空間的聯接、融合;「新基建」通過研發、製造、使用和維護,為高端科技創新提供大型科研設備,