——浪潮高性能「天、地、人」系列案例(一)
在全球氣候變暖的背景下,強暴雨、強對流、高溫、乾旱等極端的天氣氣候事件正在呈現增多的趨勢,迫使人們不得不重視極端天氣氣候事件的預報、預測和災害的防禦。這種變化給大氣研究帶來了新的挑戰,需要更高的科技水平和科技手段來提高對災害天氣的監測和預警能力。
在極端天氣氣候事件的研究中,預測無疑是非常關鍵環節,以龍捲風為例,如能對龍捲風的產生地點、走向、持續時間以及影響範圍等做出準確預測,就能提前做好避險、遷移等工作,將人員和財產損失降到最低。目前,美國已經可以做到提前13分鐘到15分鐘來發布龍捲風的預警,這也成為美國氣象現代化的標誌。
1比16,天氣預測精度和超算性能之間的博弈
一般來說,天氣預報的準確度依賴於氣象數值模式的解析度。解析度的數值是指該模式能預測多少範圍內的天氣變化,解析度的數字越小表示能預測的範圍越精細,越能為突發天氣災害、百姓日常出行提供準確的天氣依據。南京大學大氣科學學院近日承擔了多項科技部973項目、國家基金委重點研究項目,其中一項就是中尺度災害性天氣機理研究和數值預報的高時空解析度數值模擬,以及支撐全國3km高解析度的實時數值預報研究系統,這種解析度水平在國際中處於領先地位。
南京大學大氣科學學院是我國最早建立的氣象學系,在中尺度天氣、邊界層氣象、大氣環流與季風、短期氣候變率與預測等領域取得了具有國際影響和富有特色的研究成果,多次獲得省部級科技獎和國家科技進步獎。
南京大學大氣科學學院的專家介紹,「國內大部分氣候模式的解析度都在1-3KM左右,國外如美國已經能開展500米甚至200米的精度的預測,要趕上歐美國家的水平需要強大的超級計算機支撐。然而,天氣預報對計算性能需求巨大,解析度越高越需要計算性能強大的超級計算機。理論上來說,預報精度提高1倍,其所需計算量將提高16倍。」
軟、硬「兩儀」,浪潮高性能方案化解計算挑戰
一元生兩儀是對中國智慧的高度總結。針對南京大學大氣科學學院的需求,浪潮的解決方案頗有點「一元生兩儀」的意味,所謂一元指浪潮方案的一體化,所謂兩儀分別指浪潮一體化方案中的硬體方案和軟體方案。
在南京大學大氣科學學院的氣象研究模式中,基本採用WRF、ARP等模式。這些模式對計算性能的需求非常大,並且運行這些軟體時,各個CPU之間的通訊量也很大。同時,由於涉及大量的用戶和大量的小文件讀寫,氣象模式基本都對整個系統的IOPS性能都有較高要求。
在軟體的應用層面,浪潮高性能一貫提倡深度挖掘行業應用,不僅擁有一支高性能專業應用研究團隊,同時還不斷收集、積累各行業應用軟體,並進行深入測試、分析、整理,形成自己一套高性能應用特點剖析方法論。在南京大學大氣科學學院的項目中,浪潮專業應用團隊對用戶的需求進行了該方法論中的「單元測試」和「基準測試」,對用戶的應用需求進行了充分、完整的評估,然後根據評估出的數據為用戶量身定做了硬體層面的系統構建方案。
在硬體層面,浪潮根據氣象行業的應用特點,為南京大學大氣科學學院設計構建的超級計算機採用浪潮NF5280M3作計算節點,並配合光纖存儲系統浪潮AS500E,實現了所有節點全線速、無阻塞高速互聯,整系統的Linpack實測效率達到92%以上。此外,在高帶寬、大容量外,存儲的數據安全性越來越成為現在集群建設的一大難點,為此浪潮部署了一套並行文件系統,實現多節點的高可用,通過8Gb光纖網絡映射到後端存儲,保證單個節點宕機不影響系統正常讀寫到磁碟陣列。同時,考慮到氣象領域對存儲空間的需求,浪潮還為該集群配置了超800T裸容量的光纖存儲系統,可以充分滿足大氣科學院近三年存儲需求。
據悉,浪潮構建的這部超級計算機使南京大學大氣科學學院的氣候數值預報更精細化,目前WRF模式測試後可以開展1公裡級的天氣模擬和10公裡級別的短期氣候模擬;CESM全球模式則能進行1X1度左右的高解析度全球模擬。
中國廠商具備世界級系統構建能力 浪潮實力受肯定
在南京大學大氣科學學院的教授看來,將項目交給浪潮讓他們放心。「浪潮曾參與設計構建天河2號超級計算機說明浪潮具備世界級系統構建能力,同時我們也了解到我國高校最快超級計算機、我國高校第一臺百萬億次超級計算機都是浪潮設計構建的,這說明浪潮具備成功的落地項目經驗、了解高校用戶的切身需求,同時浪潮具備吉林省氣象局、南海海洋研究所等氣象領域的豐富案例,這說明浪潮具備豐富的氣象行業應用經驗。」
據了解,浪潮設有超百人的HPC服務團隊,擁有超過10年的應用調優經驗、覆蓋10個以上行業將近300個應用軟體資料庫,能夠提供HPC方案選型、應用需求分析、系統架構設計、專用產品技術驗證等專業級應用服務,並且在MIC、GPU等異構計算的應用開發、應用移植方面也具備豐富的經驗。