眾所周知,過去這些年,國內高校承擔的科研任務越來越多,對高效處理複雜運算的需求越來越強,過去只用於少數科研機構的HPC,也開始成為眾多院校必備的「基礎設施」。
如今,不僅計算力學、計算物理、計算化學、計算生物等一大批學科的教學、科研需要藉助高性能計算開展,越來越多的學科都將高性能計算作為一種解決問題的主要途徑甚至是基本手段。
在這其中,由聯想幫助南京大學搭建的超算中心,更是以每秒870萬億次的計算峰值和超過79.62%的運算效率,成為了目前國內高校頂尖的超算中心之一。
實際上,聯想不僅為南京大學打造了超算中心,在過去幾年中,聯想還為北京大學、廈門大學、青海大學、南方科技大學等高等院校建設了超算系統。
在我看來,聯想今天能在高校超算市場保持領先優勢,這背後正是聯想長期在HPC市場投入和堅持的一種體現。
高校超算之王的選擇
南京大學是中國高教HPC領域的早期開拓者和領導者,早在1980年,該校天文系就為其應用需求建設了第一套HPC系統,隨後在2001年和2007年也先後進行過HPC系統的建設。
2009年,南京大學再次擴建HPC系統,搭建的以x86架構及刀片伺服器為基礎的高性能計算中心一期項目,則以34萬億次/秒的性能指標,92%的Linpack測試效率,位列當年TOP100第七名,高校系統第一名,在當時的學術界「名噪一時」,可稱之為高校的「超算之王」。
但是,該HPC系統運行一年以後,就出現了滿負荷運行狀態,作業基本需要長時間排隊,至2015年後作業排隊現象更加嚴重,導致許多校內用戶不得已到外部尋找計算資源。有鑑於此,2015年11月,南京大學再次決定投入5000萬元建設高性能計算中心二期項目,以緩解一期集群資源嚴重不足的狀況。
在這個過程中,南京大學提出了自己的核心訴求,即高性能計算中心是面向全校師生的一個公共計算平臺,要穩定、技術要先進、性能要好,還要方便日後的擴展和管理。經過選型和招標後,聯想最終成為南京大學高性能中心二期項目的合作夥伴。
據了解,南京大學高性能計算中心二期項目部署了910個CPU計算節點,共計21840個CPU核,理論計算峰值為870萬億次/秒,系統並行計算能力的Linpack測試效率為79.62%。
與此同時,該HPC系統通過全SSD分布式並行存儲和穩定可靠高性能的GPFS並行文件系統,可滿足PB級海量數據文件的匯存需要。根據最新的SSD並行存儲I/O帶寬測試,15個節點最大隨機寫80.21GB/秒;最大隨機讀118.35GB/秒。
不僅如此,在今年年初進行的用戶應用程式測試中,包括VASP、Amber、Gaussian等中小規模測試和Gromacs、OpenMX、WRF等中大規模並行應用程式的測試結果理想,並行性能也充分達到了預期。
南京大學高性能計算中心副主任周慶林教授
對此,南京大學高性能計算中心副主任周慶林教授表示,選擇聯想進行二期項目的合作,主要有三個方面的重要原因:
第一,是南京大學高性能計算中心一期項目的建設中,選擇的是IBM的HPC系統,這套系統穩定、可靠給南大留下了深刻的印象,從使用延續性角度上來看,繼續選擇聯想可以大幅度降低新系統的學習成本。
第二,是聯想始終站在南京大學的角度考慮問題,在招標的過程中,聯想團隊和南京大學進行了多次溝通,在計算節點、存儲、網絡配置方面反覆細化需求,這讓系統運行起來之後,各項指標都超出預期,用戶也給予了高度的認可和評價。
第三,是聯想的實施和服務能力非常雄厚。實際上,聯想在國內實施的超過500個節點的超算系統項目案例比較多,這也從側面印證了聯想在大型集群計算中擁有實施經驗和技術實力。此外,聯想在服務方面也非常用心,在項目實施之後,專門安排駐校工程師保障南京大學高性能計算中心的日常運維工作。
南大超算的示範效應
根據統計,過去六年南京大學高性能計算中心完成作業數超過50萬;用戶計算總機時超過1.2億;安全運行時間超過54720小時;系統開戶數量超過150個;實際使用人數超過150人,並幫助相關學科在一流期刊上刊登了超過60篇以上的論文。
更重要的是,南京大學高性能計算中心為該校的大氣科學學院、物理學院、地球科學與工程學院、化學化工學院、工學院、天文與空間科學學院等學科的科學研究做出了巨大的貢獻。
據南京大學大氣科學學院教授雷荔傈介紹,目前南大高性能計算中心在硬體配置上,已經超過了美國國家海洋和大氣管理局的THEIA和美國國家大氣研究中心的YELLOWSTONE系統,這為他們開展科學研究帶來了極大的便利。
南京大學大氣科學學院教授雷荔傈
例如,雷荔傈團隊開展的颱風大渦模擬,多用於大氣邊界層的數值模擬、聲學及爆破等,其最大模式區域精度達12米,格點數目達3200*3200*100,單時次輸出文件大小為69.68GB,作業時共使用了3024核,輸出文件總量約為350TB。可以說,南京大學高性能計算中心的系統為這次研究提供了超強的計算能力。
不難看出,南京大學搭建的HPC系統所產生的科研價值、應用價值不可小覷。同時,作為高等院校發展的重要參考標準和核心支撐力,一套優秀的HPC系統對此類院校及其周邊地區所產生的積極影響同樣不可估量。
如今,隨著高性能計算中心計算能力的提升,越來越多的學科和校外用戶也正在利用該系統展開更多的研究。這正是南京大學高性能計算中心所帶來的「示範效應」,這種效應產生的價值不僅對南京大學,也對整個江浙地區的用戶,乃至聯想本身都有影響的深遠。
在南京大學高性能計算中心副主任董錦明看來,現在南大的老師和學生可以將他們的研究往廣度和深度方面去做拓展,這讓南大的大氣、物理等優勢學科得以極大的提升。
「從物理學科為例,目前南大正展開納米材料技術、材料設計的研究,這些新材料的開發,按照過去需要10到20年才有結果,如今藉助超算系統的計算能力,這些研究可能在3年,最長5年就有結果,大大提高了研究的速度。」他說。
確實如此,超算在國計民生中如今起到了越來越重要的作用。比如,可以解決國家面臨的重大挑戰性問題,像氣候變化問題、能源短缺問題、汙染問題;此外還能幫助國家實現經濟的轉型,特別是傳統產業的改造和升級,如高鐵、大飛機等領域;最後是社會大眾的身體健康,尤其是精準醫療背後需要高性能計算的能力。
據董錦明介紹,目前當地的醫院、天文臺等單位都對超算有著極大的需求。為此,南京大學計劃將自身的超算能力進行對外輸出,幫助當地的相關部門藉助超算解決越來越多的問題。
值得一提的是,南京大學高性能計算中心二期項目因為節點多,規模大,實施效果好,對聯想在當地開拓超算市場也打下了非常好的基礎。據聯想集團蘇皖大區DCG業務總監郝飛介紹,目前聯想在蘇皖大區HPC教育行業的中標率已經超過90%,並且在其他行業也有越來越多的客戶找聯想進行HPC項目的合作。
聯想長期投入和堅持
實際上,聯想受到包括南京大學在內的等諸多高校的認可,並不是偶然的現象,而是其對超算市場長期堅持和投入的體現,可以從幾個維度來看:
首先,聯想在超算領域的實力有目共睹。在今年的ISC17上公布的最新一期TOP500榜單中,聯想實現了「三連冠」,並以91套HPC系統的成績,成為中國第一、全球第二的HPC提供商。
其次,聯想在超算領域擁有端到端的解決方案。目前,在HPC解決方案方面,聯想擁有高性能的刀片伺服器產品,可以很好的支持超算中心的計算節點需求;也有具備高I/0吞吐能力的高端伺服器產品,適應超算中心的胖節點的需求;更有「飛虎」水冷伺服器產品,可以解決客戶對計算能耗的需求。
最後,聯想在超算領域具備較強的專業服務能力。例如,聯想能實現整機櫃產品的交付,即在產品出廠之前聯想就完成了集成和測試,提供「開箱即用」的能力;此外,聯想還提供基於GPFS、Computing等高性能計算的調優服務等等。
對此,聯想集團數據中心業務教育行業總監蔡斯揚表示,未來聯想在HPC領域還將繼續加大投入,包括超算平臺和其他新技術的融合,讓超算投資更有效率,以及對超算運維和能耗的重點關注。
聯想集團數據中心業務教育行業總監蔡斯揚
據了解,目前聯想正基於LiCO平臺深耕大數據和人工智慧市場。此前,聯想已成功開發了LiCO智能超算管理平臺,該軟體平臺集成了計算軟體、計算庫、調度軟體、監控軟體、報警軟體和分布式文件軟體等,可幫助客戶快速部署HPC集群。未來,LiCO平臺還將支持圖形識別、自然語音處理等AI應用,實現智能和超算的融合。
與此同時,蔡斯揚認為超算的日常運維管理壓力也非常大,因此聯想將致力於超算運維管理的優化,進一步釋放超算中心的生產力。此外,聯想也在推薦水冷解決方案,讓更多的水冷技術應用到校級超算中心中,希望通過這種技術能進一步降低能耗,實現校級超算中心成本的下降。
由此可見,聯想今天能在高校超算市場保持領先優勢,體現在客戶面前的可能是完善的端到端解決方案和服務,但背後依靠的是聯想在高校市場不斷精耕的堅持,對超算領域前沿技術的不斷投入,以及始終站在高校用戶角度解決問題的初心,這無疑也是聯想成功帶給中國超算市場最大的啟示。
申耀的科技觀察,由非著名科技媒體人申耀創辦、10萬公裡公路自駕經驗老斯基,在各大自媒體平臺擁有專欄,致力於科技行業的觀察和思考,在這裡讀懂科技行業,知趨勢,贏未來!