南科大尖端超算助多學科應用性能創新高

2021-01-19 IT168

  【IT168 資訊】近日,浪潮為南方科技大學(以下簡稱南科大)量身打造的超300萬億次超級計算機投入試運營,為如何實現高校的多學科、多應用的複雜超算系統構建給出了一種有效的解決方案。

  南科大是一所創新型大學,目標是迅速建成國際化高水平研究型大學,建成中國重大科學技術研究與拔尖創新人才培養的重要基地。而為了確保更快的實現建校目標,南科大需要一套高性能的超級計算機來滿足各大院系的科學計算需求,促進校內科研工作開展和成果湧現。

  多類型HPC應用需要「八面玲瓏」

  南科大的科學計算需求集中在物理、化學、生物、金融數學等院系,這導致了超算系統需要能夠承擔不同類型的HPC應用,主要包括理論物理、理論化學計算類應用、環境監測模擬類應用、生命科學類應用以及數學、經濟涉及的金融統計和大數據應用四大類。

  物理、化學和材料類應用主要使用Gaussian 09、ADF、VASP、Materials Studio、QE、Lammps、Gromacs、NWChem等軟體以及部分自主開發的代碼,典型應用包括複雜結構分子及反應機理的基礎理論研究、材料及化工過程等多尺度模擬計算;利用分子動力學相關理論及算法實現對生物大分子等體系的模擬;自主研發的太陽能發電應用模擬軟體,可擴展千核大規模應用的算例等。

  環境監測模擬類應用集中在氣象、環境、海洋學科,多使用WRF、WRF-Chem、Smoke、Gis等軟體以及自主研發算法代碼,需要三維可視化呈現,典型應用包括為環境模擬提供開發和大規模應用平臺,預測環境、氣候、水文等變化情況;

  生命科學類應用集中在生物系、化學系(質譜分析),主要應用軟體包括BWA、Velvet、Gromacs等開源軟體和部分自主研發算法代碼,涉及到基因組學、序列對比分析、拼接,蛋白質模擬,質譜分析等多項應用。

  數學、經濟類應用對計算規模的需求相對較小,主要集中於算法的實現,金融統計分析、大數據等應用可能會需要搭建MapReduce運行環境。

  浪潮超算系統兼顧計算需求與調度管理

  為滿足南科大複雜的超算系統建設需求,浪潮首先組織HPC應用專家團隊對各院系的應用需求特點進行了詳細分析,以便為後續超算系統設計提供科學的依據。如物理、化學和材料類應用,除高斯適用於大內存胖節點並行計算外,其它軟體需要較好的多節點並行擴展性,部分可利用GPU、MIC等實現加速,對編譯調優有較高要求;而環境監測模擬類應用要滿足特大項目的仿真與模擬,需要配置大內存多處理器(每節點4TB以上)計算節點,同時除商業軟體外,自主代碼需要提高並行性,包括利用GPU、MIC等加速設備,對存儲性能也有較高要求;生命科學類應用對計算能力、存儲帶寬與空間要求高,大部分軟體開源,適用於GPU、MIC等應用加速。

  經過應用診斷之後,浪潮為南科大設計了刀片+胖節點+GPU的異構超算系統,總計算峰值為326.64Tflops。而在深圳這個富有創新精神的城市,浪潮也在超算系統設計與管理上實現了多項創新:

  GPU應用創新:以Vasp應用為代表,由於其強大的功能,在基礎物理研究、計算化學、材料科學等各領域都能看到它的身影,在全球發布Vasp GPU版本之前,浪潮就已經將它運用於GPU平臺,並通過浪潮-天眼應用特徵分析軟體做了測試驗證,幫助南方科技大學更好地實現Vasp-GPU的加速,得到的測試效果如下:

  可以看到,在一定規模下,8臺安裝有一塊K40m卡的計算節點相當於24臺使用E5-2690v3處理器的計算節點,2臺安裝有2塊K80卡的節點相當於12~14個E5-2690v3節點,可見Vasp非常適合用於GPU計算,比單純用CPU計算的性價比高出許多。浪潮還通過天眼測試了GPU利用率,GPU內存帶寬,還有GPU的功耗,進一步為南科大的Vasp-GPU計算提供助力。

  高性能+大數據的統一管理和聯動:在高性能和大數據結合得越來越緊密的今天,南科大的超算系統需要既能做高性能計算,又能同時實現大數據的深度挖掘,而其中最核心的部分就是統一的管理調度憑條以及存儲系統。

  浪潮自主研發的Cluster Engine4.0系統不僅能調度高性能CPU/GPU/MIC節點,還能夠同時調度大數據節點,並同時監控各個節點的運行狀態,如下圖所示:

  同時,浪潮和Intel共同開發的TStor2000存儲系統採用的核心軟體是Intel Enterprise Edition for Lustre商業版並行文件系統,它能夠取代大數據常用的HDFS文件系統,實現Map reduce應用的性能提升,如下圖所示:

  EDR 100Gb高速Infiniband網絡:南科大很多應用的MPI通信非常頻繁,例如氣象環境海洋WRF、WRF-Chem等,需要更高速的網絡、更低的延遲。

  浪潮超算系統使用了Mellanox最新發布的EDR 100Gb Infiniband網絡,其採用324口核心IB交換機,為集群提供全線速、無阻塞的通訊服務。同時,浪潮對EDR 100Gb做了詳盡的應用測試,以WRF應用為例,2690v3平臺的CPU主頻高於2680v3的平臺,有9.5%的提升,綜合考慮計算過程中,更高主頻及更快網絡的2690v3平臺更容易達到好的計算通信比,取得更好地運行性能,如下表所示:

  浪潮曾為我國多個高校設計構建超級計算機,浪潮在南科大超算系統中展現的種種創新系統設計能力,也將有助於推動浪潮設計的超級計算機獲得更多高校的青睞。

相關焦點

  • 中國進入科研黃金時代,通用超算雲服務填補算力缺口
    「尖端超算是『高精尖』,服務於萬核以上的應用,難以走進『尋常百姓家』」,北京超級雲計算中心總經理吳迪在談到超算的應用之變時表示,「『北京超級雲計算中心』的使命就是更好的服務於通用超算市場,即萬核以下計算用戶的需求,包括科研、教育、工程設計類等,提高科研效率、降低研發成本,與尖端超算形成互補,讓各行各業大中小用戶都能用上超算,推動中國數位化經濟轉型與升級。」
  • 光啟持續發力超材料領域 推動尖端科技向民用市場的普及應用
    光啟持續發力超材料領域 推動尖端科技向民用市場的普及應用 來源:證券日報 • 2019-05-27 16:27:07
  • 中科院超算環境廣州分中心:小平臺撬動大科學
    通過分期建設,超算廣州分中心目前計算聚合能力達100萬億次,並行高通量存儲達3PB,提供100M專線高速科技網絡帶寬,集中部署了面向生物醫藥與健康等多學科領域的超算應用軟體及集成工具,可支撐大規模科學計算、數據模擬和實驗驗證。第一!在2019年的指數排名中,中心在中科院各超算分中心中位列第一名!
  • 盤點網際網路大會上的尖端科技
    Watson人工智慧類腦計算機,曾在美國一個熱門的電視智力問答節目中戰勝了兩位人類冠軍選手,將在醫療領域進行廣泛應用。  百度大腦。百度大腦有三個組成部分:一個是超大規模的計算,一個是先進的算法,另外一個是海量的大數據。百度大腦的功能包括語音、圖像、自然語言以及用戶畫像,語音技術已經達到97%的準確率。  中科院的「寒武紀1A」深度神經網絡處理器。
  • 清華運營的「神威·太湖之光」榮膺世界超算冠軍
    清華運營的「神威·太湖之光」榮膺世界超算冠軍三項應用入圍國際最高獎清華新聞網6月23日電 6月20日,在德國法蘭克福舉行的國際超算大會發布超級計算機TOP500最新榜單,中國「神威·太湖之光」計算機系統首次亮相便一舉奪冠。
  • 中國科大超算鴻雁隊再奪PAC大賽冠軍
    由計算機科學與技術學院安虹教授指導的中國科學技術大學超算鴻雁隊再次奪得優化組冠軍,並獲得應用組的銅獎和人工智慧組的並行基金獎。中國科大超算鴻雁隊自首屆PAC大賽舉辦以來,共組織了10支隊伍參加PAC大賽,並全部獲獎,共取得4金2銀2銅,以及一個「最具商業潛力獎」和一個「並行基金獎」,體現了學生們在高性能計算、大數據和人工智慧交叉研究領域,在計算方法、模型與算法、並行計算機系統及軟體實現等相關技術領域的綜合素質,充分展示了中國科大在計算機基礎教育和交叉學科領域創新實踐能力培養方面的領先優勢
  • 南科大的2019年:創新,再創新!
    2019年,南科大科研成果繼續彰顯實力,在論文發表、科研立項、院系學科建設、科研平臺建設、產學研等方面取得亮眼的成績。學校以創知推動創新,創新帶動創業的科研工作大格局正在形成,正在國內外的學術領域發揮越來越突出的影響力,以一流學術成果推動一流大學建設。
  • 未來科學發現可以「算」出來!專家呼籲推廣超算應用
    中國科學院計算技術計算研究所研究員張雲泉說,我國從早初缺乏高性能計算機,到在高性能超級計算機研究取得重大突破,開發出曙光、天河、神威·太湖之光等超級計算機,再到先後建成天津、深圳、濟南、長沙、廣州、無錫等7個國家級超算中心,並快速走向多領域的應用,這是舉國之力在超算研製、創新、應用領域,實現「超常發展」的重大創新。
  • 深圳優先布局尖端技術創新載體
    原標題:深圳優先布局尖端技術創新載體 「到2020年8月底,深圳將率先實現全市5G網絡全覆蓋,5G基站建設密度全國領先……」9月4日,深圳5G建設動員大會的一條新聞刷爆「朋友圈」,迅速佔領各大新聞網站平臺的頭條。
  • 華為超算沸騰體 申威28nm超算晶片秒殺華為7nm超算晶片
    就華為鯤鵬920來說,其實並不適合用來當超算晶片。媒體報導,「在SPECint基準測試中,鯤鵬920得分超過930分,比行業基準高出近25%,同時功耗降低30%」,報導中的意思是鯤鵬920性能強悍所以用來建超算。但實際上,SPECint基準測試測的是定點性能,而超算看重的是雙精度浮點性能。而浮點性能恰恰是鯤鵬920的弱項。而就浮點性能來說,恰恰是鯤鵬920的弱項。
  • 國家超算無錫中心「算題」超千萬項 全國位居前列
    解算的本地「題目」約佔十分之一,為產業強市提供科技力量本報訊 (記者 劉純)長久以來,應用被認為是我國超算發展的主要短板,但在國家超算無錫中心,雄渾的算力已經發揮出巨大的應用價值。中心並行優化部主管劉釗表示,對於超算來說,具備強大的性能只是一部分,能夠廣泛應用才是關鍵。高效、精準地利用超算的力量,讓遠景能源嘗到了甜頭。
  • 龍愛量子走尖端科技研發之路 以創新驅動產業發展
    龍愛量子的誕生是順應時代發展的產物,龍愛量子產業提出「以尖端技術為後盾,以創新驅動產業的發展」的發展理念更是緊扣當前社會經濟發展的大時代主題,龍愛量子技術的研發及應用,現如今不但應用到社會多個領域,而且還在社會各階層中都引起重大反響,那龍愛量子產業其魅力展現在哪些方面呢?
  • 坪山聯手南方科技大學共建南科大坪山生物醫藥研究院
    7月9日,坪山區人民政府與南方科技大學籤訂《深圳市坪山區人民政府與南方科技大學合作協議》,雙方將共建南科大坪山生物醫藥研究院。坪山聯手南方科技大學共建南科大坪山生物醫藥研究院根據協議,此次合作將在創新藥物和製藥技術兩大領域,探索「產學研用」四位一體的研究院建設模式,共建粵港澳大灣區和國內頂尖、世界一流水準的醫藥創製創新中心,推動深圳市生物醫藥產業高質量發展。
  • 比拼浮點運算速度 超算排行榜是這樣「算」出來的
    6月17日,新一期全球超算500強榜單出爐,入選500強的所有超算浮點運算速度都突破每秒千萬億次,中國超算也在前四佔有兩席位置。普通計算機用指令運算速度衡量計算性能,而超算通常用浮點運算速度來衡量其性能。那麼,什麼是浮點運算速度,超算榜單為什麼會選擇浮點運算速度來進行比較?
  • 中國散裂中子源(CSNS)——多學科應用的大科學平臺
    為使這臺裝置保持國際先進水平,滿足日益增加的多學科用戶的研究和應用的需求,因此在設計階段就留有進一步提升束流功率的餘地。首先,建成一臺重複頻率25Hz、束流功率100kW的加速器。運行一段時間後,通過提高流強,使束流功率和中子通量加倍。同時,譜儀的臺數也隨用戶的需求和功率的提高由第一階段的7臺逐步增加到最終的18臺。
  • 先進位程需求過大,臺積電再斥資8.6億元購買益通南科廠房
    根據臺積電在 20 日晚間的公告,將斥資新臺幣 8.6 億元向太陽能廠商益通購買位於南科的廠房與附屬設施,這是臺積電近期以來第 3 度在南科購買土地資產,顯示臺積電在南科的擴建企圖。r1vEETC-電子工程專輯根據公告顯示,臺積電向益通購買的南科廠房面積有 1.31 萬坪,坐落在臺南市新市區南科二路 8 號,總交易金額為新臺幣 8.6 億元,未來將用於營運及生產用途上。
  • 量子計算機「九章」問世:冷眼與嘲笑中,中國超算起步了
    珠算突破原子彈計算難題是一種藝術表現,取材於1960年前後持續一年多的原子彈攻關「九次計算」階段。不過,在真實歷史中,原子彈研製集中了當時全國最好的保障條件,除了手搖計算機、計算尺等更現代的輔助工具,電子計算機也已經開始發揮核心作用。中國電子計算機事業,在「以任務帶學科」的戰略思想指導下,從一開始就與原子彈工程有著密切聯繫。
  • ASC20超算大賽比試量子計算模擬和人工智慧英語考試
    今年的大賽賽題包括使用經典超級計算機完成量子計算模擬和訓練人工智慧模型完成英語考試試題,這些來自科學研究前沿的賽題對來自世界各國 300多支參賽高校隊伍將是前所未有的巨大挑戰。通過預賽選拔出的20支隊伍將進入到4月25日-29日在位於中國深圳的南方科技大學舉行的總決賽。
  • 6位院士齊聚 中國超算硬實力 2020CCF年會鄭重召開
    、技術精英就最新超算技術創新應用進行分享。"最近5年中國的超算有著飛快的發展,超算運力的發展牽動著國家整體科技水平的發展。超算能力甚至可以代表一個國家的未來發展能力"。超級計算設計的不只是一個部門、一個學科的運用。
  • 用超算給材料測「基因」
    中科院院士、中科院物理研究所極端條件物理重點實驗室主任汪衛華曾在接受《中國科學報》採訪時表示,我國很多關鍵材料並不能完全自給,因此希望通過先進的理念推動材料應用的發展及產業化。基於此,汪衛華實驗室在北京懷柔科學城構建了一個「材料基因工程平臺」。材料研究也有基因工程?這要從「材料基因組計劃」說起。