當下,無論是上天攬月的「嫦娥五號」,飛往火星的「天問一號」,還是下萬米深海潛航的「蛟龍號」,或是抗擊疫情中利用AI進行CT影像識別,幾乎任何一項偉大的科學成就與工業創新,都離不開高性能計算機的強力支撐。
比如為保證嫦娥五號能順利從月球取回土壤,在發射之前,需要對發射的整個過程進行模擬,包括軌道修正、近月制動、組合體分離、月面著陸、月面採樣、月面上升、交會對接與樣品轉移、環月等待與月地轉移、軌道器和返回器分離、著陸地球等,這一過程需要利用高性能計算機進行大量的仿真分析,以論證方案的可行性。除發射前的模擬測試,在發射後的飛行控制過程中,還需要實時採集大量的飛控數據進行實時處理分析,以更好地判斷相關設備的運行狀態,及時做好飛控調整。
這就是為什麼領先的科技與工業大國寧願投入巨資,也要在全球超級計算機產業中佔據一席之地的原因所在。超級計算機不僅是一個國家綜合科技實力的象徵,也是工業創新、國防建設、科學研究、石油勘探等重要經濟行業的發展基礎和動力之源。
HPC的誕生與發展
超級計算機是與高性能計算機相對應的概念。一般將信息處理能力比個人計算機快至少一到兩個數量級的計算機,歸類為高性能計算(High Performance Computing)。超級計算機發展源於大型科學工程對於超高密集計算、海量數據處理應用需求。
說到世界第一臺計算機,都知道是1946年誕生於美國賓夕法尼亞大學"ENIAC",但很少人知道,ENIAC是美國軍方為滿足美國奧伯丁試驗場計算彈道需要而研製的。在那個中國還大量使用「算盤」的時代,"ENIAC"堪稱當時的超級計算機。
從"ENIAC"誕生算起,到上世紀50年代中後期,以美蘇爭霸為背景,計算機被廣泛應用於飛彈、核武器的計算研究,這一時期的計算機特點是體積大、功耗高、可靠性差。直到1958年電晶體的出現,計算機體積開始大幅縮小,運算速度提升至最高可達300萬次,這些可以算作是超級計算機發展的前身,但僅限用於國家主導的軍事科研工程。
超級計算機真正迎來大發展,是從1964年集成電路被大規模應用開始的。我國超級計算機研製就起步於這一時期。到目前為止,大體經歷了三個階段:第一階段,自60年代末到70年代末,主要從事大型機的並行處理技術研究;第二階段,自70年代末至80年代末,主要從事向量機及並行處理系統的研製;第三階段,自80年代末至今,主要從事MPP系統及工作站集群系統的研製。
1983年12月22日,中國第一臺每秒鐘運算一億次以上的「銀河一號」巨型計算機的研究成功,才真正跨入超算競爭的行列。時至今日,中國神威·太湖之光、天河二號不僅成為全球超級計算機TOP500的「常客」,也曾成為榜單的實力擔當。如今,這些浮點計算能力達每秒萬億億次的超級計算機,其應用範圍也不再局限於軍事科研項目,在CAE仿真、動漫渲染、物理化學、石油勘探、生命科學、氣象環境都有著廣泛應用。
HPC逐漸走向平民化
在大型機時代,高性能計算基本上是IBM最擅長的陣地。從上世紀60年代到本世紀初,在全球超級計算機排行榜上,基本都是以IBM POWER處理器為內核,通過大規模並行級聯打造的平臺。
近二十年,隨著PC及伺服器需求的迅猛增長,龐大的市場需求支撐了X86處理器性能的快速提升,在不斷提升的性價比優勢,以及全新高速互連技術架構Omni-Path的合擊下,以X86處理器為核心的高性能計算產品越來越成熟,在GPU計算加速卡的加持下,正推動著HPC向更多領域普及。同時,針對典型行業HPC的藍圖參考架構、高性能生態聯盟、高性能應用框架,降低了HPC架構部署管理難度和應用開發強度,使HPC的技術門檻進一步降低。
除此之外,不斷深化的企業數位化轉型和智能化升級需求,也成為HPC走向普及的的一個重要的推動力量。隨著企業數據量的快速增長,以及大數據、人工智慧以及深度學習等技術快速融入,企業依賴更高性能的算力提供業務創新和數據分析決策。特別是近兩年備受關注的自動駕駛汽車、人臉識別、醫療診斷、工業智能以及商業決策,其核心是大數據支持,HPC成為人工智慧模型訓練的重要支撐平臺。
大數據與HPC的結合衍生出了HPDA(High Performance Data Analysis,高性能數據分析)技術。IDC數據顯示,目前有67%的HPC資源用於HPDA,而機器學習/深度學習、欺詐檢測的需求就是其中較為典型的應用。大數據時代的到來將使HPDA應用成為HPC的下一個強力增長點。預計到2021年,全球HPC存儲市場空間可達148億美金,其中新興的HPDA和HPC-based AI場景將以年化17%、29.5%的增速快速增長。
在最新發布的超級計算機TOP500榜單上,連續兩屆蟬聯第一的Fugaku(富嶽)超級計算機將其在新的混合精度HPC-AI基準上的性能提高到了2.0 exaflops,超過了6個月前1.4 exaflops的紀錄。之所以日本方面非常強調這一指標,一定程度上反應了日本超級計算機的發展思路,即瞄準日趨豐富的AI場景化應用打造更高性能超算平臺。這一技術構建趨勢,很好匹配了IDC最新研究報告對於新興HPDA和HPC-based AI場景應用的預測。
隨著CPU、GPU等處理器性能的快速提升,以及多元化算力的融合發展,打造HPC的門檻和難度正在大幅降低,HPC從小眾走向大眾是必然趨勢。HPC作為一種計算能力更強的平臺,不僅作為數字經濟時代和新基建的重要基礎,繼續在諸如科研、天文、能源、軍事等方面繼續發揮重要作用,同時在基因測序、氣象科學、工業創新、大數據分析、智能醫療、深度學習、人臉識別等新興領域,更廣泛的服務於大眾需求。
HPC前行的存儲瓶頸
這是一個最好的時代,也是一個最壞的時代。
隨著5G、大數據、AI等技術的快速發展,我們看到了HPC與大數據、AI的融合趨勢,也堅定地認為,HPDA、HPC-based AI等新興HPC場景將在各行各業全面開花,HPC普及化的時代已經到來。
然而,在CPU以摩爾定律為牽引快速提升性能的過程中,HPC發展卻面臨存儲以及I/O速度與計算能力越來越不匹配所帶來的「存儲牆」問題。眾所周知,在計算機發展過程中,CPU性能的增長是遠高於存儲性能和I/O性能的,這導致在計算機不斷發展過程中,計算、存儲、I/O 間的速度差距會越來越顯著。
2014年某機構針對數據中心的性能調查顯示,當年CPU性能增長52%,內存性能增長9%,I/O性能增長6%,而存儲性能的提升最慢,因為這不僅與介質物理性能有關,還與存儲協議有關,這種介質與協議的變化其實非常緩慢。存儲性能落後於CPU、內存帶寬性能,就意味著數據訪問能力落後於數據的處理能力。
對高性能計算機而言,由於採用的是並行計算機體系架構,由多CPU和GPU級聯打造的高性能並發算力,會如潮水一般湧入,使得「存儲牆」問題更難以克服。最終導致的結果是,CPU空轉等待存儲器訪問的時間佔了很大比例,並行計算效率大幅下降。目前大規模並行計算機在實際應用中的效率只有5%左右,存儲性能成為提升效率的最大制約。
隨著HPDA、HPC-based AI等新興場景應用的全面爆發,企業對於高性能、實時化的大數據分析需求將變得更加迫切。
在HPC領域,目前包括華為、英特爾都在通過統一多元化的異構算力來解決HPC產業發展中的算力需求,並取得明顯的成效。為克服「存儲牆」問題,包括華為在內的一批廠商也在努力,正在通過技術革新,深入研究智能存儲體系結構、高性能存儲技術等關鍵技術,減少存儲與計算之間的性能差距,打通HPC前行的「最後一公裡」。