機器學習模擬1億原子:中美團隊獲2020「超算諾貝爾獎」戈登貝爾獎

2020-11-27 騰訊網

機器之心報導

作者:澤南、張倩、小舟

在前世界第一超算 Summit 上,研究人員在保持「從頭算」精度的前提下成功模擬了 1 億原子的運動軌跡,將超大系統的分子動力學模擬帶進了一個新時代。

有超算界諾貝爾獎美稱的「戈登貝爾獎」今年頒給了一個中美合作研究團隊,他們的研究被認為是當今計算科學中最令人興奮領域的重大進展。

11 月 19 日,在美國亞特蘭大舉行的國際超算大會 SC 2020 上,美國計算機協會 ACM 公布了 2020 年戈登貝爾獎(Gordon Bell Prize)的頒獎結果。

來自中國和美國的一個研究小組獲此獎項。他們通過機器學習將分子動力學極限從基線提升到了 1 億原子的驚人數量,同時仍保證了「從頭算(ab initio)」的高精度,效率是之前人類基線水平的 1000 倍。在基於物理模型的計算、機器學習和高性能 GPU 並行集群的共同助力下,研究人員已將超大系統的分子動力學模擬帶進了一個全新時代。

研究團隊在論文中寫到:「這項工作的巨大成就在於,它在保持從頭算精度的前提下,為分子模擬的空前數量和時間尺度打開了大門,對於更好地集成機器學習和物理建模的下一代超級計算機也提出了新的挑戰。」

獲獎團隊成員包括來自 UC Berkeley 的博士後賈偉樂、副教授林霖,北京應用物理與計算數學研究所計算物理實驗室的研究員王涵,北京大學助理教授陳默涵,北京大學研究生路登輝,普林斯頓大學化學系教授 Roberto Car、數學教授鄂維南以及普林斯頓大學數學系和化學系博士張林峰。

論文作者之一,加州大學伯克利分校博士後賈偉樂。

該研究通訊作者,北京大數據研究院實習研究員、普林斯頓大學博士生張林峰。

北京大學發來的祝賀中寫到:在這項工作裡,該研究團隊在物理建模、機器學習與高性能計算的交叉學科領域取得突破,基於深度學習的分子動力學模擬通過機器學習和大規模並行的方法,將精確的物理建模帶入了更大尺度的材料模擬中,有望在將來為力學、化學、材料、生物乃至工程領域解決實際問題發揮更大作用。

獲獎團隊做了什麼?

著名物理學家理察 · 費曼曾說過:「人類總是在不斷地嘗試理解生命,在這條道路上,如果非要我們說出一個最強大的假設,那就是:所有的東西都是由原子組成的,生物所做的一切都可以通過原子的振動和擺動來理解。」

分子動力學(MD)是一種計算機模擬方法,可以用來分析原子和分子在一段固定的時間內如何移動與交互。分子動力學模擬可以幫助科學家理解某個系統(從單個細胞到氣體雲)隨時間流逝發生的演變。分子動力學的實際應用包括大分子的研究,如用於藥物研發的蛋白質。

在模擬中,從頭算分子動力學(Ab initio Molecular Dynamics,AIMD)用不同於標準分子動力學的方法計算原子間的力,其所能達到的精度水平使其成為科學家 35 年來首選的模擬方法。但 AIMD 也有缺點,就是需要的計算量非常高,因此這方面的研究通常局限於小型系統(最多包含幾千個原子的系統)。

在今年的戈登貝爾獎獲獎論文中,研究團隊引入了 Deep Potential 分子動力學(DPMD)。DPMD 是一種基於機器學習的新方法,每天能夠模擬 1 億個原子超過 1 納秒的軌跡。雖然近年來分子動力學領域湧現了一些其他的基於機器學習的模擬方法,但獲獎論文的作者表示,他們的研究首次在保持「從頭算」精度的前提下實現了 1 億個原子的高效分子動力學模擬。

論文連結:https://dl.acm.org/doi/pdf/10.5555/3433701.3433707

具體來說,之前模擬的系統最大包含 100 萬個矽原子(速度 = 4X 10^(-3) s/step/atom),模擬速度最快達到 1.3X 10^(-6) s/step/atom (9000 個水原子系統)。而這項研究模擬了 6.79 億個水分子,1.27 億個銅原子。速度也比之前最快的模擬提高了幾個數量級。

在算法的創新方面,研究團隊寫道:

為了有效利用 Summit 異構系統架構提供的算力,我們的目標是將幾乎所有的計算任務和大量的通信任務遷移到 GPU。由於 DP 模型中計算粒度的大小相對有限,直接的 GPU 實現會遇到很多瓶頸,效率不高。因此,我們做出了以下算法方面的創新:

(1)通過引入一種新的相鄰列表數據分布,避免了在計算嵌入矩陣時出現分支,從而增加了 DeePMD 的計算粒度;

(2)相鄰列表的新數據結構中的元素被壓縮為 64 位整數,以便 GPU 對自定義 TensorFlow 算子進行更高效的優化;

(3)為 DP 模型開發了混合精度計算,計算密集型任務以單精度或半精度執行,而不降低物理觀測的精度。

由於戈登貝爾獎表彰在高性能計算方面的成就,決賽選手必須證明他們提出的算法可以在世界上最強大的超級計算機上高效運行。於是,獲獎團隊開發了一份高度優化的代碼(GPU Deep MD-Kit)並在美國能源部橡樹嶺國家實驗室的 Summit 超級計算機上順利運行,在雙精度下實現了 91 PFLOPS 的速度,在混合單 / 半精度下實現了 162/275 PFLOPS 的速度。Summit 超級計算機是 IBM 計劃研發的一款超級計算機,目前在全球超級計算機 Top500 新榜單中排名第二。

戈登貝爾獎

戈登貝爾獎由美國計算機協會(ACM)設立於 1987 年,是國際高性能計算應用領域最高獎,每年頒發一次。該獎項主要頒發給高性能應用領域的最傑出成就。

戈登貝爾獎通常會由當年 TOP500 排行名列前茅的計算機系統應用獲得,例如美國「泰坦」超級電腦、日本「京」超級計算機上的應用軟體都曾獲得此獎。獎項設立後近 30 年,都由美國和日本的軟體獲得此獎,直到 2016 年,中國研究團隊打破了這一壟斷。

2016 年,戈登貝爾獎授予了基於國家超級計算無錫中心的全球最快超算系統「神威 · 太湖之光」運行的應用「千萬核可擴展全球大氣動力學全隱式模擬」,由中國科學院軟體研究所、清華大學、北京師範大學、國家並行計算機工程技術研究中心,以及國家超級計算無錫中心的聯合團隊共同完成。

2016 年戈登貝爾獎領獎現場。

2017 年,中國超算項目再獲戈登貝爾獎,由清華大學地球系統科學系副教授付昊桓等共同領導的團隊所完成的「非線性地震模擬」摘得。這一成果是由清華大學地球系統科學系、計算機系與山東大學、南方科技大學、中國科學技術大學、國家並行計算機工程技術研究中心和國家超級計算無錫中心等單位共同完成的。

2017 年戈登貝爾獎獲獎證書。

參考內容:

http://www.is.cas.cn/tpxw2016/201611/t20161119_4698490.html

https://www.acm.org/media-center/2017/november/gordon-bell-prize-2017

歷屆戈登貝爾獎:https://awards.acm.org/bell/award-winners

https://zhuanlan.zhihu.com/p/139559620

Amazon SageMaker1000元大禮包

ML訓練成本降90%,被全球上萬家公司使用,Amazon SageMaker是全託管機器學習平臺,支持絕大多數機器學習框架與算法,並且用 IDE 寫代碼、可視化、Debug一氣呵成。

現在,我們準備了1000元的免費額度,開發者可以親自上手體驗,讓開發高質量模型變得更加輕鬆。

相關焦點

  • 中美合作團隊摘得2020年戈登·貝爾獎 8位獲獎者7張中國面孔
    ACM將本年度的該獎項頒給了一支由中美科學家組成的研究團隊,他們因「結合分子建模、機器學習和高性能計算相關方法,將具有從頭算精度的分子動力學模擬的極限提升至1億個原子規模」獲獎。從頭算分子動力學(AIMD)是一種與標準分子動力學略有不同的方法,它在模擬過程中可計算原子間相互作用力。AIMD的精確度使其成為科學家的首選模擬方法,然而,該方法需要更多的計算,因此僅限於研究最大具有數千個原子的小型系統。
  • 2020戈登-貝爾獎出爐,8人「夢之隊」,有5位北大人!
    當地時間2020年11月19日下午,在全球高性能計算、網絡、存儲和分析大會上,國際高性能計算應用領域最高獎—戈登貝爾獎(ACM Gordon Bell Prize)揭曉。獲得2020年ACM戈登·貝爾獎的是一支由中美科學家組成的團隊。
  • 清華浪潮計算地球科學獎推動中國首獲戈登貝爾獎—新聞—科學網
    在剛剛結束的全球超算大會SC16上,「千萬核可擴展全球大氣動力學全隱式模擬」代表中國應用首獲全球超算應用的最高獎項「戈登貝爾獎」,實現了中國在此獎項上歷史性的突破
  • 戈登·貝爾獎出爐:8人團隊7張中國面孔
    ,他們因「結合分子建模、機器學習和高性能計算相關方法,將具有從頭算精度的分子動力學模擬的極限提升至1億個原子規模」獲獎。分子動力學是一種計算機模擬實驗方法,可以分析原子和分子在固定時間段內如何移動和相互作用。從頭算分子動力學(AIMD)是一種與標準分子動力學略有不同的方法,它在模擬過程中可計算原子間相互作用力。
  • 8人團隊中7張中國面孔
    ACM將本年度的該獎項頒給了一支由中美科學家組成的研究團隊,他們因「結合分子建模、機器學習和高性能計算相關方法,將具有從頭算精度的分子動力學模擬的極限提升至1億個原子規模」獲獎。從頭算分子動力學(ab initio Molecular Dynamics,AIMD)是一種與標準分子動力學(SMD)略有不同的方法(ab initio在拉丁語中是「從頭開始」或「從第一原理開始」的意思),它在模擬過程中可計算原子間相互作用力。
  • 它花1分鐘 超算需億年
    計算玻色採樣問題,「九章」處理5000萬個樣本只需200秒,而目前世界最快的超算需6億年。這是我國首次實現「量子計算優越性」。眼下,研製量子計算機已是世界科技前沿的最大挑戰之一。去年,谷歌公司推出53個超導量子比特的計算機「懸鈴木」,對一個數學算法的計算效率遠超當時世界最快的超級計算機,率先實現了「量子優越性」。而「九章」則實現了「高斯玻色取樣」任務的快速求解。處理5000萬個樣本的高斯玻色取樣問題,「九章」只需200秒,而目前世界上最快的超算則需要6億年;處理100億個樣本,「九章」需10個小時,超級計算機則需要1200億年。
  • 鄭緯民:相信濟南超算在產業應用上會領先全國
    2016年獲何梁何利基金科學與技術進步獎。2016年獲得戈登貝爾獎。12月27日,在2019濟南國際超級計算產業博覽會上,中國工程院院士、清華大學計算機科學與技術系教授鄭緯民在接受本報專訪時表示,濟南超算已有比較好的基礎。下一階段,濟南需要將超算在智能製造、智能城市、智能醫療等領域用好,相信會走在全國前列。
  • 那些追著超算跑的科學家
    那些追著超算跑的科學家來源:中國教育報 2016-11-19 蔣芳 蔡玉高  18日揭曉的「戈登貝爾獎」讓中國超算應用團隊成為世界矚目的焦點。他們成功背後有著怎樣的經歷與感受?追逐速度的意義是什麼?記者專訪了三支入圍該獎項的中國科研團隊研發人員。
  • 它花1分鐘,超算需億年
    計算玻色採樣問題,「九章」處理5000萬個樣本只需200秒,而目前世界最快的超算需6億年。這是我國首次實現「量子計算優越性」。眼下,研製量子計算機已是世界科技前沿的最大挑戰之一。去年,谷歌公司推出53個超導量子比特的計算機「懸鈴木」,對一個數學算法的計算效率遠超當時世界最快的超級計算機,率先實現了「量子優越性」。而「九章」則實現了「高斯玻色取樣」任務的快速求解。處理5000萬個樣本的高斯玻色取樣問題,「九章」只需200秒,而目前世界上最快的超算則需要6億年;處理100億個樣本,「九章」需10個小時,超級計算機則需要1200億年。
  • 「九章」計算機:它花1分鐘,超算需億年
    計算玻色採樣問題,「九章」處理5000萬個樣本只需200秒,而目前世界最快的超算需6億年。這是我國首次實現「量子計算優越性」。  眼下,研製量子計算機已是世界科技前沿的最大挑戰之一。  處理5000萬個樣本的高斯玻色取樣問題,「九章」只需200秒,而目前世界上最快的超算則需要6億年;處理100億個樣本,「九章」需10個小時,超級計算機則需要1200億年。正如陸朝陽所說的那樣:「『九章』在一分鐘時間裡完成了經典超級計算機一億年才能完成的任務。」
  • 清華運營的「神威·太湖之光」榮膺世界超算冠軍
    清華運營的「神威·太湖之光」榮膺世界超算冠軍三項應用入圍國際最高獎清華新聞網6月23日電 6月20日,在德國法蘭克福舉行的國際超算大會發布超級計算機TOP500最新榜單,中國「神威·太湖之光」計算機系統首次亮相便一舉奪冠。
  • 它花1分鐘 超算需億年
    處理5000萬個樣本的高斯玻色取樣問題,「九章」只需200秒,而目前世界上最快的超算則需要6億年;處理100億個樣本,「九章」需10個小時,超級計算機則需要1200億年。正如陸朝陽所說的那樣:「『九章』在一分鐘時間裡完成了經典超級計算機一億年才能完成的任務。」
  • 全球最快學術超算!科學家利用Frontera精準模擬新冠病毒如何在體內...
    全球最快學術超算!據該團隊的預期,他們的冠狀病毒模型將包含大約2億個原子。這是一項艱巨的任務,因為必須計算每個原子之間的相互作用。她的團隊的工作流程採用混合或集成建模方法。2020年3月12日至13日,Amaro實驗室在Frontera的多達4,000個節點或約250,000個處理核心上進行了分子動力學模擬。
  • 它花1分鐘,超算需億年
    計算玻色採樣問題,「九章」處理5000萬個樣本只需200秒,而目前世界最快的超級計算機需要6億年。這是我國首次實現「量子計算優越性」,這一突破也使我國成為全球第二個實現「量子優越性」的國家。12月4日,《科學》雜誌發表了該成果。
  • 廣州「天河二號」超算天氣預報可精確到「1公裡」
    廣州超算中心(「天河二號」超級計算機)自成立5年以來,不斷加強人才團隊建設,提升服務效能,全面支持大科學、大工程、新產業發展,推動廣州市科技創新與產業轉型升級,取得顯著應用效益。目前用戶覆蓋全國各地,是全世界用戶數量最多、應用領域最廣的超算中心之一。
  • 「九章」計算機助力我國首次實現「量子計算優越性」它花1分鐘,超算需億年
    計算玻色採樣問題,「九章」處理5000萬個樣本只需200秒,而目前世界最快的超算需6億年。這是我國首次實現「量子計算優越性」。眼下,研製量子計算機已是世界科技前沿的最大挑戰之一。去年,谷歌公司推出53個超導量子比特的計算機「懸鈴木」,對一個數學算法的計算效率遠超當時世界最快的超級計算機,率先實現了「量子優越性」。而「九章」則實現了「高斯玻色取樣」任務的快速求解。處理5000萬個樣本的高斯玻色取樣問題,「九章」只需200秒,而目前世界上最快的超算則需要6億年;處理100億個樣本,「九章」需10個小時,超級計算機則需要1200億年。
  • 「九章」計算機助力我國首次實現「量子計算優越性」,它花1分鐘,超算需億年
    計算玻色採樣問題,「九章」處理5000萬個樣本只需200秒,而目前世界最快的超算需6億年。這是我國首次實現「量子計算優越性」。眼下,研製量子計算機已是世界科技前沿的最大挑戰之一。去年,谷歌公司推出53個超導量子比特的計算機「懸鈴木」,對一個數學算法的計算效率遠超當時世界最快的超級計算機,率先實現了「量子優越性」。而「九章」則實現了「高斯玻色取樣」任務的快速求解。處理5000萬個樣本的高斯玻色取樣問題,「九章」只需200秒,而目前世界上最快的超算則需要6億年;處理100億個樣本,「九章」需10個小時,超級計算機則需要1200億年。