機器之心報導
作者:澤南、張倩、小舟
在前世界第一超算 Summit 上,研究人員在保持「從頭算」精度的前提下成功模擬了 1 億原子的運動軌跡,將超大系統的分子動力學模擬帶進了一個新時代。
有超算界諾貝爾獎美稱的「戈登貝爾獎」今年頒給了一個中美合作研究團隊,他們的研究被認為是當今計算科學中最令人興奮領域的重大進展。
11 月 19 日,在美國亞特蘭大舉行的國際超算大會 SC 2020 上,美國計算機協會 ACM 公布了 2020 年戈登貝爾獎(Gordon Bell Prize)的頒獎結果。
來自中國和美國的一個研究小組獲此獎項。他們通過機器學習將分子動力學極限從基線提升到了 1 億原子的驚人數量,同時仍保證了「從頭算(ab initio)」的高精度,效率是之前人類基線水平的 1000 倍。在基於物理模型的計算、機器學習和高性能 GPU 並行集群的共同助力下,研究人員已將超大系統的分子動力學模擬帶進了一個全新時代。
研究團隊在論文中寫到:「這項工作的巨大成就在於,它在保持從頭算精度的前提下,為分子模擬的空前數量和時間尺度打開了大門,對於更好地集成機器學習和物理建模的下一代超級計算機也提出了新的挑戰。」
獲獎團隊成員包括來自 UC Berkeley 的博士後賈偉樂、副教授林霖,北京應用物理與計算數學研究所計算物理實驗室的研究員王涵,北京大學助理教授陳默涵,北京大學研究生路登輝,普林斯頓大學化學系教授 Roberto Car、數學教授鄂維南以及普林斯頓大學數學系和化學系博士張林峰。
論文作者之一,加州大學伯克利分校博士後賈偉樂。
該研究通訊作者,北京大數據研究院實習研究員、普林斯頓大學博士生張林峰。
北京大學發來的祝賀中寫到:在這項工作裡,該研究團隊在物理建模、機器學習與高性能計算的交叉學科領域取得突破,基於深度學習的分子動力學模擬通過機器學習和大規模並行的方法,將精確的物理建模帶入了更大尺度的材料模擬中,有望在將來為力學、化學、材料、生物乃至工程領域解決實際問題發揮更大作用。
獲獎團隊做了什麼?
著名物理學家理察 · 費曼曾說過:「人類總是在不斷地嘗試理解生命,在這條道路上,如果非要我們說出一個最強大的假設,那就是:所有的東西都是由原子組成的,生物所做的一切都可以通過原子的振動和擺動來理解。」
分子動力學(MD)是一種計算機模擬方法,可以用來分析原子和分子在一段固定的時間內如何移動與交互。分子動力學模擬可以幫助科學家理解某個系統(從單個細胞到氣體雲)隨時間流逝發生的演變。分子動力學的實際應用包括大分子的研究,如用於藥物研發的蛋白質。
在模擬中,從頭算分子動力學(Ab initio Molecular Dynamics,AIMD)用不同於標準分子動力學的方法計算原子間的力,其所能達到的精度水平使其成為科學家 35 年來首選的模擬方法。但 AIMD 也有缺點,就是需要的計算量非常高,因此這方面的研究通常局限於小型系統(最多包含幾千個原子的系統)。
在今年的戈登貝爾獎獲獎論文中,研究團隊引入了 Deep Potential 分子動力學(DPMD)。DPMD 是一種基於機器學習的新方法,每天能夠模擬 1 億個原子超過 1 納秒的軌跡。雖然近年來分子動力學領域湧現了一些其他的基於機器學習的模擬方法,但獲獎論文的作者表示,他們的研究首次在保持「從頭算」精度的前提下實現了 1 億個原子的高效分子動力學模擬。
論文連結:https://dl.acm.org/doi/pdf/10.5555/3433701.3433707
具體來說,之前模擬的系統最大包含 100 萬個矽原子(速度 = 4X 10^(-3) s/step/atom),模擬速度最快達到 1.3X 10^(-6) s/step/atom (9000 個水原子系統)。而這項研究模擬了 6.79 億個水分子,1.27 億個銅原子。速度也比之前最快的模擬提高了幾個數量級。
在算法的創新方面,研究團隊寫道:
為了有效利用 Summit 異構系統架構提供的算力,我們的目標是將幾乎所有的計算任務和大量的通信任務遷移到 GPU。由於 DP 模型中計算粒度的大小相對有限,直接的 GPU 實現會遇到很多瓶頸,效率不高。因此,我們做出了以下算法方面的創新:
(1)通過引入一種新的相鄰列表數據分布,避免了在計算嵌入矩陣時出現分支,從而增加了 DeePMD 的計算粒度;
(2)相鄰列表的新數據結構中的元素被壓縮為 64 位整數,以便 GPU 對自定義 TensorFlow 算子進行更高效的優化;
(3)為 DP 模型開發了混合精度計算,計算密集型任務以單精度或半精度執行,而不降低物理觀測的精度。
由於戈登貝爾獎表彰在高性能計算方面的成就,決賽選手必須證明他們提出的算法可以在世界上最強大的超級計算機上高效運行。於是,獲獎團隊開發了一份高度優化的代碼(GPU Deep MD-Kit)並在美國能源部橡樹嶺國家實驗室的 Summit 超級計算機上順利運行,在雙精度下實現了 91 PFLOPS 的速度,在混合單 / 半精度下實現了 162/275 PFLOPS 的速度。Summit 超級計算機是 IBM 計劃研發的一款超級計算機,目前在全球超級計算機 Top500 新榜單中排名第二。
戈登貝爾獎
戈登貝爾獎由美國計算機協會(ACM)設立於 1987 年,是國際高性能計算應用領域最高獎,每年頒發一次。該獎項主要頒發給高性能應用領域的最傑出成就。
戈登貝爾獎通常會由當年 TOP500 排行名列前茅的計算機系統應用獲得,例如美國「泰坦」超級電腦、日本「京」超級計算機上的應用軟體都曾獲得此獎。獎項設立後近 30 年,都由美國和日本的軟體獲得此獎,直到 2016 年,中國研究團隊打破了這一壟斷。
2016 年,戈登貝爾獎授予了基於國家超級計算無錫中心的全球最快超算系統「神威 · 太湖之光」運行的應用「千萬核可擴展全球大氣動力學全隱式模擬」,由中國科學院軟體研究所、清華大學、北京師範大學、國家並行計算機工程技術研究中心,以及國家超級計算無錫中心的聯合團隊共同完成。
2016 年戈登貝爾獎領獎現場。
2017 年,中國超算項目再獲戈登貝爾獎,由清華大學地球系統科學系副教授付昊桓等共同領導的團隊所完成的「非線性地震模擬」摘得。這一成果是由清華大學地球系統科學系、計算機系與山東大學、南方科技大學、中國科學技術大學、國家並行計算機工程技術研究中心和國家超級計算無錫中心等單位共同完成的。
2017 年戈登貝爾獎獲獎證書。
參考內容:
http://www.is.cas.cn/tpxw2016/201611/t20161119_4698490.html
https://www.acm.org/media-center/2017/november/gordon-bell-prize-2017
歷屆戈登貝爾獎:https://awards.acm.org/bell/award-winners
https://zhuanlan.zhihu.com/p/139559620
Amazon SageMaker1000元大禮包
ML訓練成本降90%,被全球上萬家公司使用,Amazon SageMaker是全託管機器學習平臺,支持絕大多數機器學習框架與算法,並且用 IDE 寫代碼、可視化、Debug一氣呵成。
現在,我們準備了1000元的免費額度,開發者可以親自上手體驗,讓開發高質量模型變得更加輕鬆。