解密NVIDIA GPU加速宇宙學N體模擬計算 | 公開課預告

2021-01-06 手機鳳凰網

宇宙學N體模擬是研究外太空星系形成、暗物質、暗能量等重大科學問題的重要手段,目前N體模擬常用的算法之一是粒子網絡(Particle-Mesh,PM)算法。為準確模擬出宇宙的結構,宇宙學家們需要同時模擬數億個粒子的演化。在模擬過程中,計算機需要估算所有粒子之間的重力,並在模擬過程中計算所有粒子對,需要超高的算力支持;同時,數十億個粒子的模擬需要消耗較多的內存容量。因此,超高的算力和內存需求也是宇宙學家們在實際工作研究過程中面臨的主要挑戰。

廈門大學天文系宇宙科學課題組自主研發了宇宙學數值模擬軟體CUBE,並依託上海交通大學π 2.0超算平臺,成功完成了4.4萬億粒子的宇宙大尺度結構N體模擬Cosmo-π測試,追蹤了137億年以來的宇宙演化,是目前世界上完成粒子數目最多的宇宙學N體模擬。

CUBE採用定點壓縮技術,極大的降低了內存消耗,結合雙層PM+PP算法,能將每個N-body粒子的內存消耗減少到僅6個字節,比傳統PM算法低一個數量級。並使用包括混合精度計算、通信優化在內的方法對CUBE進行了性能優化,可以在較低的內存消耗下實現較高的計算效率和可擴展性。

除了上述算法層面的優化,課題組還與上海交通大學超算平臺團隊進行合作,在上海交通大學π 2.0超算平臺上進行了CUBE的移植和優化研究,將N體模擬中的熱點Particle-Particle引力求解部分嘗試性地進行CUDA移植,單步運行速度提升了5.16倍左右,在4臺DGX-2共64塊V100上的弱擴展效率是83.8%。

1月6日,智東西公開課推出NVIDIA GPU 加速科學計算專場,主題為《宇宙學N體模擬在異構計算平臺的移植和優化研究》,由上海交通大學計算機系碩士研究生胡航以視頻直播形式進行講解。

胡航的主要研究方向為高性能計算,協助物理與天文學院完成了宇宙學數值模擬應用在π 2.0超算平臺上的移植和優化工作。

本次講解,胡航將從宇宙學N體模擬研究現狀、粒子網絡算法原理、面臨的計算挑戰、CUBE的技術實現及其在異構計算平臺上實現GPU端訪存、負載均衡、計算指令以及多GPU並行擴展等方面的優化工作,進行系統講解。

高性能科學計算是智東西公開課開設的「NVIDIA專場」的重點關注領域之一。目前,「NVIDIA專場」已經陸續邀請過多位學者和專家,講解他們在地球科學、空間天氣預報、理論物理、藥物設計等多個科學計算領域,利用GPU進行加速和優化的研究成果和寶貴經驗。

清華大學計算機系博士後甘霖就《面向典型地球科學應用的GPU優化方案》這一主題,對氣候模擬、油氣資源勘探等地球科學應用中的GPU優化方案進行了深度講解;

清華大學計算機系副教授都志輝以《GPU加速空間天氣預報》為主題,系統講解了GPU加速技術在實時空間天氣預報中的應用;

中科院理論物理研究所科學計算與信息平臺負責人侯豐堯老師以《GPU編程及其在物理中的應用》為主題,從理論物理中的典型應用和具體實例出發,深入講解了GPU編程在理論物理中的應用和性能調優方法;

上海交通大學生命學院長聘教授魏冬青、麗臺科技資深產品經理蔡欣欣以《超級計算在藥物設計研究中的應用》為主題,深入講解了GPU加速技術在藥物設計、精準藥物發現中的應用。

相關焦點

  • NVIDIA GPU 加速科學計算專場上線,主講宇宙學N體模擬在異構計算...
    宇宙學N體模擬是研究外太空星系形成、暗物質、暗能量等重大科學問題的重要手段,目前N體模擬常用的算法之一是粒子網絡(Particle-Mesh,PM)算法。為準確模擬出宇宙的結構,宇宙學家們需要同時模擬數億個粒子的演化。
  • NVIDIA 安培架構 GPU 公開課下周開講,詳解 NVIDIA GPU 如何加速抗疫藥物研發及科學新發現|直播預告
    在藥物研發過程中,研究團隊需要對幾十萬種分子進行分子動力學模擬計算,來進行藥物篩選。如果需要再進一步研究不同蛋白質之間的相互作用,其計算量將達到天文級別,面對如此複雜的模擬過程和龐大的計算量,常規的計算機已經無法滿足其需求。
  • NVIDIA DGX A100公開課下周開啟,首次講解 NVIDIA 最強 GPU DGX...
    NVIDIA DGX A100公開課下周開啟,首次講解 NVIDIA 最強 GPU DGX A100 640GB系統|直播預告 GPT-3一經發布就引起了業內的轟動,其網絡架構中包含1750億個參數,模型層數達到96層,是有史以來最複雜的語言模型
  • NVIDIA GPU虛擬化公開課上線!兩位專家詳解NVIDIA vGPU及面向高...
    NVIDIA GPU虛擬化公開課上線!兩位專家詳解NVIDIA vGPU及面向高性能需求的VDI桌面雲 | 公開課預告 虛擬化並不是一項新技術,指的是將計算機的各種實體資源,予以抽象、轉換後呈現出來並可供分割、組合為一個或多個電腦配置環境。
  • NVIDIA Ampere GPU 架構公開課下周直播!NVIDIA中國區工程及解決方案總監賴俊傑博士主講 | 直播預告
    相比上一代Volta架構V100 GPU,NVIDIA A100 GPU實現了5大技術突破:1、Ampere架構,也是A100的核心,採用7nm工藝,包含540億個電晶體,面積達到826mm²,是目前最大的7nm處理器;2、第三代張量核心(Tensor Core),計算更加靈活、速度更快、使用更容易。
  • 不同領域如何有效使用NGC加速應用開發 | 超級公開課NVIDIA專場預告
    目前NGC平臺可以支持深度學習、機器學習、高性能計算等不同領域的七十多款軟體。1月29日晚8點,超級公開課NVIDIA專場第20講將開講,由NVIDIA機器學習解決方案架構師路川主講,主題為《不同領域如何有效使用NGC加速應用開發》。
  • 深度學習訓練時GPU溫度過高?幾個命令,為你的GPU迅速降溫
    https://zhuanlan.zhihu.com/p/27682206這篇文章寫的是在ubuntu X server環境下,通過修改nvidia-settings來修改GPU風扇速度,因為默認的nvidia-settings設置是,即使GPU在計算的時候溫度已經達到85度,風扇速度最高不會超過70%,這樣就無法很好地為GPU進行散熱,因此需要手動修改GPU風扇速度。
  • 如何在 GPU 上加速數據科學
    無論您是用 pandas 處理一個大數據集,還是用 Numpy 在一個大矩陣上運行一些計算,您都需要一臺強大的機器,以便在合理的時間內完成這項工作。在過去的幾年中,數據科學家常用的 Python 庫已經非常擅長利用 CPU 能力。Pandas 的基礎代碼是用 C 語言編寫的,它可以很好地處理大小超過 100GB 的數據集。
  • NVIDIA 安培架構 GPU 實戰公開課下周開啟,詳解如何為高校科學研究...
    高校科學研究涉及的方向多、領域廣,比如地質分析、分子模擬、冷凍電鏡、光子與聲子結構分析、光力學研究、量子光學研究、結構流體仿真等。科學研究除了對專業能力有著較高的要求,往往還會涉及大量的數學建模和計算需求,也給科研工作者提出了很多的挑戰,比如科研項目中大規模數據帶來的存儲和傳輸問題,複雜模型帶來的高算力要求等。
  • NVIDIA Quadro RTX 6000 GPU評估
    NVIDIA Quadro RTX 6000計算相關基準我們將比較Quadro RTX 6000與我們不斷增長的數據集。Geekbench 4Geekbench 4使用圖像處理,計算機視覺和數字運算來衡量GPU的計算性能。
  • NVIDIA專家直播講解如何使用開源工具DASK和RAPIDS加速數據分析與建模 | 公開課預告
    RAPIDS和DASK是NVIDIA開源的加速數據科學計算的擴展包,可以加速金融領域的數據建模。DASK是一個可以將Python軟體包擴展到多臺機器上的工具,可以在同一系統或多節點群集中的多個GPU上分布數據和計算,同時可與RAPIDS cuDF,XGBoost和RAPIDS cuML集成在一起,用於GPU加速的數據分析和機器學習。
  • GTC DLI 實戰培訓第五課:加速計算基礎 —— CUDA Python
    NVIDIA GTC DLI年度公開課報名已開始!2020年12月6日-12日為您帶來一場深度學習和加速計算的知識風暴!12月10日,為您帶來GTC DLI實戰培訓第五講:加速計算基礎 —— CUDA Python
  • 踢掉 Docker 後,Kubernetes 還能歡快地跑 GPU?
    CUDA™ 是一種由 NVIDIA 推出的通用並行計算架構,該架構使 GPU 能夠解決複雜的計算問題。它包含了 CUDA 指令集架構(ISA)以及 GPU 內部的並行計算引擎。這裡安裝的方式和顯卡驅動安裝類似。
  • 本地GPU?雲GPU?怎麼選?
    用戶可以通過所有主流雲平臺訪問NVIDIA數據中心GPU,包括:阿里雲(https://www.alibabacloud.com/product/gpu)AWS(https://www.nvidia.com/en-us/data-center/gpu-cloud-computing
  • 直播預告:Achronix攜手智東西開講「人工智慧與FPGA加速」公開課
    全球領先的高性能、高容量FPGA晶片及解決方案提供商Achronix將攜手智東西,於下周二開講「人工智慧與FPGA加速」公開課,介紹Achronix Speedster7t架構創新與加速應用;該器件將FPGA的靈活性與ASIC的速度結合在一起,全面提升人工智慧應用的性能。
  • 深度學習訓練時 GPU 溫度過高?輸入這幾行命令就能迅速降溫
    具體地址:http://t.cn/RK9wyBK這篇文章寫的是在ubuntu X server環境下,通過修改nvidia-settings來修改GPU風扇速度,因為默認的nvidia-settings設置是,即使GPU在計算的時候溫度已經達到85度,風扇速度最高不會超過70%,這樣就無法很好地為GPU進行散熱,因此需要手動修改GPU風扇速度。
  • 在deepin15下的安裝帶gpu加速的LAMMPS(聽說GPU加速很香)
    Would you like to run the nvidia-xconfigutility to automatically update your x configuration so that the NVIDIA x driver will be used when you restart x?
  • Win10提示您未連接到nvidia gpu的顯示器的解決方法
    不過,最近一些 windows10系統 用戶在使用N卡過程中,遇到了提示「您當前未使用連接到nvidia gpu的顯示器」,根本無法打開Nvidia控制面板,該怎麼辦呢?該問題是由於驅動程序文件損壞或安裝驅動程序失敗導致的,在本文中PConline小編給大家分享下具體解決方法!
  • 教程| 如何使用Kubernetes GPU集群自動訓練和加速深度學習?
    Tausch 在 GitHub 上發布了一篇詳細教程,「可以幫助研究人員和愛好者們用他們的 Kubernetes GPU 集群輕鬆地對深度學習的訓練過程進行自動操作和加速。」機器之心對本教程進行了編譯。
  • 深度學習篇——Tensorflow-GPU配置
    pip 安裝 Tensorflow-gpucuda配置最新的Tensorflow-gpu 使用的是cuda 9.0.dll的內容,所以就要下載那你的電腦的顯卡不支持tensorflow-gpu加速。點擊 同意並繼續如果你不知道你要安裝些什麼,那麼請你勾選,精簡。