宇宙學N體模擬是研究外太空星系形成、暗物質、暗能量等重大科學問題的重要手段,目前N體模擬常用的算法之一是粒子網絡(Particle-Mesh,PM)算法。為準確模擬出宇宙的結構,宇宙學家們需要同時模擬數億個粒子的演化。在模擬過程中,計算機需要估算所有粒子之間的重力,並在模擬過程中計算所有粒子對,需要超高的算力支持;同時,數十億個粒子的模擬需要消耗較多的內存容量。因此,超高的算力和內存需求也是宇宙學家們在實際工作研究過程中面臨的主要挑戰。
廈門大學天文系宇宙科學課題組自主研發了宇宙學數值模擬軟體CUBE,並依託上海交通大學π 2.0超算平臺,成功完成了4.4萬億粒子的宇宙大尺度結構N體模擬Cosmo-π測試,追蹤了137億年以來的宇宙演化,是目前世界上完成粒子數目最多的宇宙學N體模擬。
CUBE採用定點壓縮技術,極大的降低了內存消耗,結合雙層PM+PP算法,能將每個N-body粒子的內存消耗減少到僅6個字節,比傳統PM算法低一個數量級。並使用包括混合精度計算、通信優化在內的方法對CUBE進行了性能優化,可以在較低的內存消耗下實現較高的計算效率和可擴展性。
除了上述算法層面的優化,課題組還與上海交通大學超算平臺團隊進行合作,在上海交通大學π 2.0超算平臺上進行了CUBE的移植和優化研究,將N體模擬中的熱點Particle-Particle引力求解部分嘗試性地進行CUDA移植,單步運行速度提升了5.16倍左右,在4臺DGX-2共64塊V100上的弱擴展效率是83.8%。
1月6日,智東西公開課推出NVIDIA GPU 加速科學計算專場,主題為《宇宙學N體模擬在異構計算平臺的移植和優化研究》,由上海交通大學計算機系碩士研究生胡航以視頻直播形式進行講解。
胡航的主要研究方向為高性能計算,協助物理與天文學院完成了宇宙學數值模擬應用在π 2.0超算平臺上的移植和優化工作。
本次講解,胡航將從宇宙學N體模擬研究現狀、粒子網絡算法原理、面臨的計算挑戰、CUBE的技術實現及其在異構計算平臺上實現GPU端訪存、負載均衡、計算指令以及多GPU並行擴展等方面的優化工作,進行系統講解。
高性能科學計算是智東西公開課開設的「NVIDIA專場」的重點關注領域之一。目前,「NVIDIA專場」已經陸續邀請過多位學者和專家,講解他們在地球科學、空間天氣預報、理論物理、藥物設計等多個科學計算領域,利用GPU進行加速和優化的研究成果和寶貴經驗。
清華大學計算機系博士後甘霖就《面向典型地球科學應用的GPU優化方案》這一主題,對氣候模擬、油氣資源勘探等地球科學應用中的GPU優化方案進行了深度講解;
清華大學計算機系副教授都志輝以《GPU加速空間天氣預報》為主題,系統講解了GPU加速技術在實時空間天氣預報中的應用;
中科院理論物理研究所科學計算與信息平臺負責人侯豐堯老師以《GPU編程及其在物理中的應用》為主題,從理論物理中的典型應用和具體實例出發,深入講解了GPU編程在理論物理中的應用和性能調優方法;
上海交通大學生命學院長聘教授魏冬青、麗臺科技資深產品經理蔡欣欣以《超級計算在藥物設計研究中的應用》為主題,深入講解了GPU加速技術在藥物設計、精準藥物發現中的應用。