「小科小科,吃飯去啊。」
「你們先去吧,等會人少了我再去。最近事太多,我要抓緊把這組數據跑個結果出來,導師催著要呢。」
「你還在用咱們實驗室的集群在跑嗎?」
「是啊,實驗室買了這麼多伺服器,可還是跑的很慢。」
「你去超算中心啊,他那邊跑的快很多。」
「我之前試過,那邊排隊太長了,比我們實驗室快不了多少。」
「現在他們新買的華為HPC平臺,規模比之前大了很多,作業周轉快基本不用排隊。而且I/O特別快,算我們這種作業快得不要不要的。」
「真的嗎?那我們一起吃飯,最近天天晚去吃剩飯都快不行了。回來我趕緊試試華為的平臺。」
小科下午登錄超算中心的系統,提交了幾個計算作業。不用不知道,一用就見識了這個平臺的快:下午提交的作業到凌晨依次運行完畢,第二天一早就拿到了需要的計算結果。
「幸虧你推薦我去超算中心跑程序,不然用實驗室的集群估計還要跑10天半個月,少不了挨導師批。」
第二天中午小科在食堂吃飯輕鬆多了。
幫助小科的這個平臺叫做「瀚海20超級計算系統」,他擁有CPU計算集群30480顆核,系統理論峰值性能2.52Pflops,實測HPL雙精度浮點計算能力:700個節點1.43PFlops,計算效率為63.95%,甚至部分計算節點HPL效率跑出了71%以上的超高性能。」瀚海20系統」採用InfiniBand HDR100100Gbps網絡技術構建的全線速的高速計算網絡,在600納秒的極低延遲下,每秒可發送2億條消息,讓用戶獲得更快的網絡性能,也是全國高校首例。
不光是小科同學,中科大合肥微尺度物質科學國家研究中心的胡老師針對大尺度分子固體材料的第一性原理計算模擬,以自主開發的第一性原理線性標度計算軟體DGDFT[JCP 143, 124110 (2015)]為基礎,開發低標度、低通訊,低內存、低訪存的並行計算方法,實現超大規模高性能並行計算,DGDFT採用了多級MPI並行以及高效求本徵值方法,DGDFT具有高度可擴展性,本次測試在某校外超算和「瀚海20系統」超算平臺上分別計算金屬石墨烯C2880(2880個碳原子),在相同核數下的絕對計算速度比該校外超算運行快30%以上。
該系統也為科研用戶提供了多種計算選擇,採用20臺華為Taishan伺服器構建全自研的鯤鵬生態計算集群。華為Taishan伺服器採用了自研鯤鵬架構,該架構晶片在部分單精度和整型計算應用程式性能表現優異,可用於生物信息學計算軟體,和流體力學計算。中國科大網絡信息中心張煥傑老師利用其實現了ARM平臺甄別郵件系統中用戶弱口令問題,由原來的X86單機1天,縮短到利用Taishan伺服器30幾秒即可完成,大大縮短了處理時間,提高了郵件系統的安全性。
中科大「瀚海20系統」不光好用還省錢,系統採用液冷技術進行高效散熱,可循環使用的冷卻水流經CPU、內存等高發熱量器件,80%的熱量直接由冷卻水帶走,大幅降低超算中心的散熱能耗。華為承諾基礎設施10年以上的壽命,設備5年以上的壽命,充分保護了用戶投資。「瀚海20系統」的720臺華為X6000液冷高密伺服器計算節點僅需10個機櫃即可部署,每個機櫃72個節點39KW的超高密計算系統,相比傳統伺服器每年至少可節省電費17餘萬元。
中心主任李京教授說,在華為的幫助下,我們成功建設了超算平臺「瀚海20系統」,已穩定高效運行7個多月,整個系統運行流暢、運維簡單、綠色節能,能夠滿足師生日益增長的高性能計算的要求,相信中科大的師生在瀚海20系統上繼續產出高水平研究成果。「工欲善其事,必先利其器」,相信這套先進、高效的「瀚海20系統」超算平臺,將更好地助力中科大各院校師生開展科學研究,極大地促進中科大的雙一流建設發展。