如果我們把喜馬拉雅山炸開一道甭多了50公裡寬的口子,世界屋脊還留著,把印度洋的暖風引到我們這裡來,試想一下,那我們美麗的青藏高原從此摘掉落後的帽子不算,還得變出多少個魚米之鄉?——電影《不見不散》
作為賀歲片的代表作,這部電影已經深入人心,許多人對葛優的這段臺詞也是耳熟能詳。但可能許多人不知道,這段話並非是葛大爺或者編劇的臨時創作,而是有著確切的出處。早在20多年前,中華大地上就有人提出了這樣的構想,這個人叫做牟其中。圍繞在他身邊的是是非非並不是我們今天要討論的問題,我們只是好奇「炸開喜馬拉雅山」這件事,真的靠譜嗎?
「我們當然不能真的去炸山,但是我們可以採用數值模擬的手段,製造一個虛擬的地球。任何有趣的想法、大膽的想法、天馬行空的想法,都可以藉助數值模擬去實現」,清華大學地球系統科學系副教授、地球系統數值模擬教育部重點實驗室副主任黃小猛博士如是說。
黃教授的主要研究方向包括海洋模式、並行計算和大數據,即通過計算機進行地球系統數值模擬的相關研究,簡稱為地學研究。「地學是一個非常古老、非常重要的基礎學科,在傳統地學當中,我們研究的主要對象就是我們人類賴以生存的地球環境,包括大氣圈、水圈、冰雪圈、巖石圈、生物圈等等,還包含地幔、地核等等,構成有機的整體」。
但是由於地學研究的特殊性,不可能向生物、化學實驗那樣進行人工操作,一方面是物理條件不具備,另一方面則是投入的財力、物力、人力不可估量,所以更多時候地學研究都是基於高性能計算進行模擬,也就是與計算機科學緊密的結合在一起。
雖然聽起來地學研究相當高大上,甚至讓人覺得有些高不可攀,但其實它與我們每個人的生活都是息息相關的,比如我們每天都在看的天氣預報就是基於地學研究而實現的。我們經常聽到全球氣候變暖這樣的說法,而地學研究其實早就對這一現象進行了計算機模擬仿真,從而用科學手段和計算數據指導我們的生產與生活。這一切,都得益於地學研究與計算機應用的突破。
「在地學研究中,高性能計算機主要應用在三個方面,首先是海量數據的分析和處理,其次是將這些數據應用到地球數值模擬的模型當中,最後則是在計算的精度上進行提升,從原本的10公裡精確到1公裡甚至更小的範圍」,黃教授介紹說。
乍聽起來,這些應用並沒有什麼新奇,但是在實際科研中每一項進步都面臨著巨大的挑戰。比如在最初的海量數據分析中所需要處理的數據量非常巨大,其中包括了觀測數據、模型輸出數據、實測觀測臺站的數據等等。按照2011年《Science》雜誌相關文章的介紹,到2030年需要進行的模擬數據總量將要超過300個PB,這也勢必要求用於處理的高性能計算機具備強大的計算能力和海量的存儲空間。
同樣,面對如此龐大的數據,如何將其應用在系統模型當中,如何藉助於公式進行海量數據的計算,也對計算機的性能產生了進一步的挑戰。我們知道,傳統地學應用的公式都是得益於科學推演,而在海量數據的應用規模下,進行這樣的推演將耗費巨大的時間。如果能夠將計算機的性能提升10%哪怕是1%,都會節省大量的科研時間。
而精度的細化更使得地學研究面臨巨大的挑戰。許多人都聽過《國王與麥子》的故事,棋盤上每個方格所需要的麥穗會呈指數級增長,同樣當我們將計算範圍從10公裡精確到1公裡,所需要的計算量則對應提升了成百上千倍,這也對高性能計算機的性能產生了進一步的需求。「據我所知,我國最快的神威太湖之光計算機有大約一半的算力都在進行地學應用模擬」,黃教授補充說。
但是這依然遠遠不夠。從以上三點我們可以看出,地學研究對於高性能計算機和高性能計算能力有著近乎無限的需求,同樣計算機的發展程度也影響了地學研究的發展狀況。那麼,難道我們就需要默默等待計算機的發展,在這個「後摩爾定律」時代等待硬體性能的小幅度提升嗎?是否有一種技術快速吻合地學發展的需求呢?
答案就是四個字——人工智慧。其實如今,人工智慧計算已經融入我們生活的方方面面,我們出行、購物等許多方面都可以看到AI的身影。同樣在科研領域,AI也在幫助像黃教授這樣的專家們解決實際遇到的問題,並且為地學研究提供了另一種實現的可能。
「AI有強大的能力,就是從大數據當中找規律,增強我們對地學的某些現象的預測能力。比如我們對於高溫熱浪、冰川冰雪的融化等自然災害一直採用的是傳統的數理方程或者是統計方法進行預測,但是在積累了大量的數據之後,我們還可以通過AI進行數據分析、推理和預測,充分發揮AI非線性擬合的能力」。黃小猛教授介紹道。
浪潮人工智慧與高性能產品部應用開發負責人劉羽對於AI與HPC的融合也有自己的理解。在他看來,其實不僅僅是地學研究,包括整個HPC應用都與AI有著密切的關係:「傳統的HPC是用我們已知的物理方程進行大量的演化,計算量非常大,但是也因為模擬時間很長,會積累一些誤差,某些混沌現象也可能會放大;但是在藉助於AI之後,因為AI是基於數據提煉的方法,就好比經驗豐富的老專家,就可以把傳統計算過程中的明顯錯誤進行修正,預測的精度和整體的時間緯度預測可以更長」。
除了能夠彌補傳統計算誤差的問題之外,在計算資源的需求方面,AI也要小得多。所以對於類似於APEC或者奧運會之類的重大需求,就可以通過AI進行場館周邊半小時或者一小時為頻次、甚至幾分鐘之內的氣象預報模擬計算,保障重大活動的進行。這也是HPC與AI互補的重要體現之一,或者從另一個角度來說,至少在天氣預報領域,AI可以為傳統HPC提供有效的輔助作用。
「地球是一個龐大的星球,人類觀測有衛星開始的數據也不過就三十幾年,這樣的數據跟我們想研究的地球億萬年年齡相比較,還是非常稀疏的。所以我們認為在未來相當長的時間內,AI還是以輔助的姿態與傳統模型結合,甚至可以將模型輸出的數據用來訓練AI,進一步促進兩者之間的融合」, 黃教授表示。
當然,相對於傳統HPC應用來說,AI應用還比較「年輕」,無論是藉助於深度神經網絡還是其他技術,都需要全新的知識體系來掌握,自然也需要相關人才的培養。在這一點上,浪潮與清華大學一直以來都有密切的合作,兩者甚至設立了計算地球科學的人才基金,獎勵40歲以下從事計算地球科學的青年人才。
「我們希望讓更多專注於相關研究的青年科學家們共同推動獎項建設,也推動計算地球科學方向的發展,讓越來越多的人,特別是學生和青年人,能夠參與我們這個方向的建設」,黃小猛教授感慨道。