遇見容器HPC 蘭州大學的高性能計算應用之路

2020-11-13 天極網

「當今,科學研究可分為三種:實驗、理論和計算。」

  ——諾貝爾獎得主,威爾遜

  如果說,在科學的發展長河中,伽利略和牛頓奠定了實驗科學和理論科學的基石。那麼,計算機的發明,則把計算推上了人類科學活動的另一個前沿,此後,計算在科學活動中發揮著越來越重要的作用。

  例如,被稱為「上帝粒子」的希格斯(Higgs)玻色子是2012年度最大的科學突破。它的發現和捕捉之路離不開歐洲核子研究中心(CERN),而對撞實驗項目則離不開背後的大規模數據處理,大量的數據處理則需要依靠高性能計算(HPC)。

  不僅如此,近年來,計算在生命科學、天文物理學、醫學、系統科學等各種科學中,所發揮的作用日益增大。並且,在氣象、核技術、石油勘探、航空航天、裝備製造研發、運輸交通等國民與國防建設的很多重要領域中,計算成了必不可少的手段。

  「網際網路的應用有兩大驅動力,一個是商業的網際網路,另一個就是科研領域,1994年中國接入網際網路之後,接入的第一個科研應用就是高能物理。」蘭州大學網絡安全與信息化辦公室主任陳文波主任在接受採訪時說。

  蘭州大學的HPC之「難」

  蘭州大學是教育部直屬的全國重點綜合性大學,是國家「985工程」和「211工程」重點建設高校之一,於2017年入選教育部世界一流大學建設名單,並且有4個學科入選世界一流學科建設名單。


  據了解,高性能計算作為蘭州大學的科研工具扮演了極其重要的角色,「我們平臺的超算能力是1200萬億,在西部高校的HPC規模應該是最大的。」 蘭州大學網絡安全與信息化辦公室主任、超算中心主任陳文波主任說。

  學校先後在物理、化學、大氣學院等學院建設了高性能計算中心,給各學院的教師和學生提供了科研支撐。「在上世紀80年代,全國開始建立計算中心,蘭大就是其中之一,當時用的是日本富士通的機器,之後,又從中小型機過渡到X86伺服器,2004、2015年開始採用計算集群,到了2010年後,各學院開始了自建…….」陳主任回顧了蘭州大學的HPC應用之路。

  目前,雖然各學院分散建設高性能計算中心的模式在一定程度上滿足了現有的科研需求,但也存在著諸多問題,難以滿足學校長遠的發展。主要表現在:

  1、資源浪費:各學院獨立建設高性能計算集群,物理設備或部門之間的隔離導致資源無法共享,造成資源嚴重浪費;

  2、運維管理複雜:各學院老師需要承擔各院高性能計算集群設備的運維管理工作,無法更好地聚焦科學研究;

  3、採購成本高:由於高性能計算集群建設沒有做到全校一盤棋統籌,導致高性能計算相關的設備採購成本及運營成本居高不下;

  4、用戶體驗差:由於大多數有科學計算需求的師生都是非計算機專業出身,存在對超算系統概念不了解、環境不熟悉、使用門檻高的問題。對於一名通常只有2~3年研究時間的學生來說,基礎配置和調試等工作佔用了大量的研究時間;

  5、不利於交叉學科發展:學科交叉點是科學新的生長點、新的科學前沿,而校級平臺是學科交叉的溫床,但各院獨立建設的現狀無法滿足高性能計算中交叉學科的發展需求;

  面對以上的種種問題,蘭州大學亟需統籌規劃全校的高性能計算中心建設,構建全校統一的高性能計算公共服務平臺。但是統一建設仍面臨著很多新的挑戰,例如,如何實現計算資源的靈活調度?如何實現用戶的業務隔離?如何實現作業的合理調度?

  遇見容器HPC

  據蘭州大學網絡安全與信息化辦公室超算中心高級工程師 張洋老師回憶,早在五六年前,在蘭州大學跟美國聖地牙哥超算中心合作項目的時候,開始對容器HPC有初步的了解並持續關注。所以在規劃建立統一的高性能計算平臺的時候,優先考慮使用容器HPC。據悉,針對蘭州大學在統一高性能計算平臺的建設過程中面臨的問題,華為利用自身大量的行業數位化轉型經驗和生態夥伴的整合能力,攜手聯科提供的基於容器的HPC解決方案在眾多競標者中脫穎而出。

  據了解,此方案運用雲計算技術、前端展示以及移動計算等技術,打破了傳統校園計算中心的建設模式,通過容器的隔離和鏡像打包功能,將平臺管理員從複雜的管理工作中解放出來,建立基於容器技術的高效公共計算雲平臺的管理模式和應用服務體系,讓用戶像使用手機一樣,方便的使用高性能計算,通過行動裝置隨時隨地的提交任務,查看結果。最終,通過容器解決方案,做到計算環境快速部署和切換。

  「早期做方案調研的時候,我們找了五個學院的應用進行測試,觀察其性能的損耗,因為對HPC應用來說,性能是優先需要考慮的,結果是,經過測試後,容器確實性能損耗和物理機相比基本上沒有多大的區別,並且,多節點的MPI應用也都能跑起來。」張老師說。

  具體來說,容器HPC解決方案統一部署之後,給蘭州大學帶來了顯而易見的價值:

  首先,簡管理。建立統一的計算平臺,通過用戶管理子系統,對平臺使用者的身份進行認證、審批、權限控制、配額信息管理、用戶組及用戶成員關係等管理,幫助學校實現計算平臺的在各學院的租戶化管理、運營;

  其次,降成本。通過容器隔離子系統,在同一個計算平臺上同時運行不同版本的作業系統,擁有獨立的網絡配置(包括高速乙太網以及高速IB計算網),並可訪問不同的存儲空間及數據集。保證虛擬化的資源性能與物理性能損失小於1%,滿足科學與應用數據中心高性能計算的需求;

  再次,均資源。通過任務調度子系統,實現從多種計算資源中選擇最合適的節點啟動容器。並通過資源監控模塊、作業執行監控模塊以及作業調度算法模塊實現最合理的作業調度,實現多個學院的用戶在平臺上能夠均衡地獲取到資源。

  寫在最後

  教育科研水平直接代表著國家的科技實力與能力。在過去,我國在高性能計算的應用方面,一直和歐美存在著差距,「如今,我國超算的發展是爆炸式的,我們已經慢慢從學習的階段走向了應用階段。」陳主任在採訪結束時表示。

  當前,國內高校HPC應用迎來了一個黃金時代,而容器HPC將引領高校的超算發展,助力高校科研的繁榮之路。

相關焦點

  • 遇見容器HPC——蘭州大學的高性能計算應用之路
    據了解,高性能計算作為蘭州大學的科研工具扮演了極其重要的角色,「我們平臺的超算能力是1200萬億,在西部高校的HPC規模應該是最大的。」 蘭州大學網絡安全與信息化辦公室主任、超算中心主任陳文波主任說。「在上世紀80年代,全國開始建立計算中心,蘭大就是其中之一,當時用的是日本富士通的機器,之後,又從中小型機過渡到X86伺服器,2004、2015年開始採用計算集群,到了2010年後,各學院開始了自建…….」陳主任回顧了蘭州大學的HPC應用之路。
  • HPC CHINA 2019:航空航天領域高性能計算應用
    中國一年一度高性能計算領域的盛會——全國高性能計算學術年會(HPC CHINA 2019)在內蒙古呼和浩特盛大開幕!、燃燒、傳熱、多相流、計算性能優化等方向應用交流,促進航空航天領域技術交流和高性能計算應用發展。
  • 遇見懂行人,蘭州大學的高性能計算應用之路
  • EPYC與Instinct MI100重新定義HPC和科研計算性能
    —微軟宣布新型HBv3虛擬機將支持代號為「Milan」的下一代AMD EPYC處理器— —首個使用AMD CDNA架構、專用於高性能計算(HPC)工作負載的加速顯卡AMD Instinct MI100—
  • 四方面提升 微軟HPC Server 2008推動高性能計算
    他認為,高性能計算最重要的是如何來提升機器性能,因此從作業系統的角度加以提高是非常關鍵的。微軟進入高性能計算領域已經多年,而經過不懈的努力,現在Windows HPC Server 2008 R2(編註:本文提到的R2均為測試版)在性能上已經不弱於其他系統,微軟關注的是如何讓客戶現有的投資重新利用起來,不管是軟體還是硬體,幫助客戶更好地管理高性能計算機的超級計算。
  • 2019年人工智慧對高性能計算的10種影響
    2.語言:高級程序設計 Fortran程序在消耗周期方面佔據了高性能計算的主導地位,C和C ++程序幾乎耗盡了高性能計算中的其他資源。通常通過C接口、擴展和庫來支持加速器周期。嘗試使用新語言來破壞這種情況已經失敗,因為現有語言具有適合構成高性能計算的應用程式的用戶、代碼和支持。
  • 高性能計算之源起——科學計算的應用現狀及發展思考
    2013年10月,美國哈佛大學Martin Karplus教授、史丹福大學Michael Levitt教授和南加州大學AriehWarshel教授3位科學家獲得了諾貝爾化學獎,獲獎理由是「為複雜化學系統創立了多尺度模型」。評選委員會在聲明中指出,對當今的化學家而言,計算機已成為與試管同等重要的工具,計算機對生命現象的模擬已為化學大部分研究成果的取得立下了「汗馬功勞」。
  • 高性能電磁計算應用與軟體開發研討會在京召開
    2月5日,中科院高技術局在中國科學院網絡信息中心組織召開了高性能電磁計算應用與軟體研討會,來自中科院電子所、電工所、數學院、物理所、網絡中心,以及北京理工大學、上海交通大學的20餘位專家學者參加了本次研討會。
  • 智能計算、邊緣計算環境下的雲原生進化之路
    Kubeflow + Volcano 加速機器學習平臺容器化進程近10年來,AI發展迅速。在AI訓練過程中,涉及到硬體、作業系統、驅動、程式語言和運行時、存儲和資料庫、框架、上層應用預算法等多層技術堆棧,應用K8s,則能讓用戶屏蔽程式語言以下的所有堆棧,更多關註上層技術實現。
  • 沒有超級計算機,也敢玩高性能計算?
    「隨著成本的下降和應用情形的增多,高性能計算吸引了各種類型和規模的新用戶。擴展應用包括基於超級計算機的高性能計算系統、基於集群的高性能計算和高性能計算服務雲。通常,高性能計算應用情形主要集中在某種類型的仿真上。谷歌雲首席技術官辦公室高性能計算和量子計算技術總監Kevin Kissell解釋說:「例如,機翼氣流模擬、發動機燃燒、行星天氣系統、核反應以及投資組合估值等。」其他應用情形則針對分析目標,例如,衡量廣告投資回報率,或者評估業務部門的績效等。還有其他的應用情形可以歸類為轉換應用或者轉型應用。他說:「比如電影和視頻渲染。」
  • 如何讓 Gaussian 計算飛起來?
    (2)基於Gaussian 16版本多核並行計算測試以上數據來源:https://www.hpc.co.jp/library/benchmark/benchmark20150706/這個測試分別對8核、16核、32核、44核進行求解,從計算結果看,多核並行加速比到32核很理想,44核已經對求解沒有多大提升了。
  • HPC大計算:挑戰深度學習的計算力黑洞
    9月24日,由亞洲超算協會聯合浪潮等主辦的2015高性能計算用戶大會在北京舉行,大會圍繞目前的新技術趨勢提出「大計算」理念。高性能計算可以顯著降低工業設計、研發和生產的成本,並大幅度提升效率,是實現工業4.0最重要的創新工具之一。
  • 蘭州大學研究生招生信息網,蘭州大學考研信息網,蘭州大學研招,蘭州...
    蘭州大學大氣科學學院2020年大學生夏令營第一輪通知 為進一步引導和激發大學生從事科研的興趣和熱情,蘭州大學大氣科學學院將舉辦大學生夏令營活動,歡迎來自全國各地的優秀在校大學生報名參加,現將相關事項通知如下:一、大氣科學學院簡介
  • 第十四屆全國高性能計算學術年會兩千人共享盛會,綻放青島!
    2018年10月20日,主題為「HPC+一切皆可計算」第十四屆全國高性能計算學術年會(HPC China2018)在青島勝利閉幕!大會特邀中國科學院陳國良院士、吳立新院士,中國工程院陳左寧院士、王恩東院士,齊魯工業大學黨委書記王英龍研究員,CCF高性能計算專業委員會主任孫凝暉研究員出席大會。
  • 美能源部高性能計算應用項目推動先進位造發展
    導語 11月13日,美國能源部能源創新高性能計算網站宣布,其製造業高性能計算(HPC4Mfg)專題啟動4個項目。為了深入了解其中的物理化學相互作用,並得出獲得最大熱解效率的最佳操作條件,該項目採用高性能計算對反應器進行建模。該項目將形成高效的大型熱解系統(具備約200噸/天的處理能力),可顯著減少美國廢棄塑料的積壓。
  • 「2016理論與高性能計算化學國際會議」舉行
    (COSCAR)計算化學虛擬實驗室(VLCC)主辦的「2016理論與高性能計算化學國際會議」(International Conference on Theoretical and High Performance Computational Chemistry 2016, ICT-HPCC16)在重慶召開。
  • 華南理工大學HPC伺服器案例
    華南理工大學是直屬教育部的全國重點大學,坐落在南方名城廣州。 經過五十多年的建設和發展,華南理工大學成為立足華南,面向全國,以工為主,理工結合,管、經、政、法、文、藝協調發展的綜合性大學。 切實實現高性能並行計算應用分析,高性能並行計算的應用軟體位於高性能計算生態系統的最上層,針對不同的行業有專業的產品,針對各個領域的科學與工程計算應用,直接為用戶創造價值。這些軟體原來大多運行在大型主機上,是面向多個處理器、多進程、多任務的單節點軟體,進程之間的通信通過大型主機作業系統的消息機制進行,消息機制的啟動通過函數進行調用。
  • 六院士聯袂出席HPC CHINA 2020
    作為年度高性能計算領域規模最大、規格最高的學術研究和應用成果展示盛會,第16屆HPC CHINA 高性能計算學術年會及主題論壇將於9月28日-30日隆重召開。,共話高性能計算前沿研究應用及未來發展趨勢。
  • 浪潮ISC19發布AI HPC融合一體機
    德國當地時間 6 月 17 日,在法蘭克福舉行的 2019 國際超算大會(ISC19)上,浪潮發布AI HPC融合一體機,通過與英特爾的技術合作,為高性能計算(HPC)與人工智慧(AI)用戶提供靈活、高效、易用的融合架構IT基礎設施。近年來,AI的興起為HPC開啟了新的應用領域。