比拼浮點運算速度 超算排行榜是這樣「算」出來的

2020-11-29 環球網

6月17日,新一期全球超算500強榜單出爐,入選500強的所有超算浮點運算速度都突破每秒千萬億次,中國超算也在前四佔有兩席位置。

普通計算機用指令運算速度衡量計算性能,而超算通常用浮點運算速度來衡量其性能。那麼,什麼是浮點運算速度,超算榜單為什麼會選擇浮點運算速度來進行比較?500強特別是前十的超算,科學家們都在想哪些辦法讓浮點運算速度越來越快?節能環保是對超算的另一衡量指標,超算要節能環保,最新的研究思路和實現策略又有哪些?6月19日,科技日報記者帶著這些問題,走訪了業內相關專家。

浮點運算速度 衡量超算性能的基準程式之一

「超級計算機被稱為『國家重器』,屬於國家戰略高技術領域,是世界各國競相角逐的科技最高點。目前,高性能計算機領域市場競爭日趨激烈,美國、歐洲、日本和中國都在加速超級計算機的研發。」國家超級計算無錫中心主任楊廣文說。

「浮點運算速度是指計算機系統每秒可以處理的浮點操作,通常用FLOPS來表示。」江南大學物聯網工程學院副院長柴志雷副教授說,超算榜單選擇浮點運算速度作為對比參考,是因為超級計算機主要用於科學計算領域,而這些領域的計算主要採用浮點數。

江蘇理工學院計算機工程學院副院長範洪輝副教授告訴記者,浮點是指小數點位置不固定的數,它們執行的算術運算會消耗大量計算資源並可能產生誤差,所以單位時間內浮點運算的次數,是衡量超算性能的基準程式之一。

常州信息職業技術學院軟體與大數據學院錢銀中博士表示,計算機只能存儲和處理整數,通過整數乘以某個基數的整數次冪,是計算機表示實數尤其是小數的方法。

「浮點運算在運算數大小變化範圍很大的場合可以實現很高的計算精度,是科學研究中的典型運算。大多數處理器中,都有專門處理浮點運算的浮點運算單元(FPU),FLOPS就是浮點運算單元的執行速度。」錢銀中說。

中國高性能計算重點研發專項總體組組長、中山大學數據科學計算機學院院長錢德沛表示,選用浮點運算速度作為超算運算能力的評價標準,是因為科學工程計算軟體中包含了大量的浮點數運算,浮點運算速度快的計算機通常也能夠更快運行相關的科學工程計算軟體。

把複雜的工作細分 超算界沒有最快只有更快

超級計算機具有很強的計算和處理數據的能力,主要特點表現為高速度和大容量,配有多種外部和外圍設備及高性能軟體系統。現有的超級計算機運算速度,大都可以達到每秒一萬億次以上。

常州信息職業技術學院電子工程學院牛傑博士介紹,超級計算機的創新設計在於把複雜的工作細分並分配給不同的處理器。根據阿姆達爾定律,超級計算機的設計都集中在減少軟體序列化、用硬體在瓶頸上加速。

目前,世界排名前十的超算,基本都是通過優化CPU(中央處理器)與GPU(圖形處理器)之間的連接網絡結構來提升GPU和協處理器性能,增加內存容量、擴充存儲容量、增大網絡帶寬、藉助運算加速卡等方式提升算力,最終在高性能計算系統、網絡架構、系統軟體、應用支撐等關鍵技術上取得突破。

柴志雷認為,提升超級計算機系統的浮點處理能力,不是單純讓浮點運算本身更快,而是從整個系統的角度,提升晶片工藝,優化系統架構、節點計算性能、存儲訪問性能、節點間通信等,從而使得系統的整體能力得到提升。目前,還經常採用在系統中增加加速器等方法,來獲得更高計算效率。

錢銀中介紹,實現超算的技術有大規模並行計算法,這種方法使多個處理器一起工作,每個處理器處理一個大問題中的不同任務。這種方法有兩種實現途徑:一種是網格計算法,多個計算機連接成分散的分布式結構,分屬不同的控制區域,當需要計算機時從中擇機選擇;另一種是把處理器組織為關係緊密的集群。現代超算使用無限帶寬系統、三維環面互連等技術,在大規模並行系統中提高集群的速度和靈活性。

國家超級計算無錫中心先進位造部部長任虎介紹,目前,提高浮點運算速度的方法主要有:提高晶片計算核心的時鐘頻率,增加晶片中計算核心的數量,通過多流水線、乘加融合(FMA)等技術增加單位時間內處理浮點運算的能力。

例如,曙光星雲採用了自主研發的超並行處理體系結構、神威藍光超算採用了大規模並行處理體系結構、天河一號採用了多陣列可配置協同並行體系結構、天河二號採用了自創的新型異構多態體系結構。此外,網際網路、存儲、系統軟體、應用軟體、電源和冷卻等系統都對超算的性能有著重要的影響,所以超算的世界裡沒有最快,只有更快。

Green500 超算界針對能效的排行榜

「節能環保是衡量超算的另一指標。超算中心是高性能計算機的規模應用,功率密度高,且長期運行在高負荷率條件下,耗能極高。通過優化軟硬體配置確實能降低一部分功耗,但最根本源頭是要研發計算性能優異且超低功耗的高性能處理器。目前,如何實現低能耗的超算是全球科學家研究的熱點問題。」 範洪輝告訴記者。

牛傑介紹,超算界還有一種被稱為「Green500」的排行,就是以計算機每瓦功耗可以提供的計算速率為指標,針對超級計算機能效的排行榜。

從歷年的評測結果來看,刀片伺服器一般比集群式伺服器更節能,被廣泛使用在超算系統中。Green500排名靠前的前三大系統都採用了PEZY加速器,而前十大的其餘系統則使用NVIDIA GPU作為加速器。其中,PEZY系統採用的是液體冷卻方式,也就是說,整個系統浸沒在液體中,這比透過板載空氣或水更具有節能效率。

超算深騰7000可以實時定位計算機的熱源分布和結構特點,採用取消全部風扇、在每套機櫃內安裝噴淋蒸發冷卻循環系統的方法,完成了產品的實施。該項目與傳統的風冷、水冷技術相比,具有冷卻效率高、溫度分布均勻、低噪音、低功耗、可靠性高等優點。

相對風冷,中國的「神威藍光」超算中心,利用複雜的水冷系統,實現CPU、內存、元器件的冷卻並帶走熱量,幾乎不損耗水且無噪音,先進環保,就像三明治夾心,水冷板被緊緊地夾在兩塊CPU板中間,無縫同步散熱。

如何讓超算實現低能耗?柴志雷認為,低功耗計算也是超級計算機研製的重要方面,從晶片製造、架構設計、軟體設計多個層次都需要做大量的工作。比如在架構設計上,可以通過增加異構加速單元,提升系統的能效比。

範洪輝提出,重點應降低每個部件的耗能,尤其是CPU的能耗。同時要改善存儲器件的設計,減少數據行進的距離;讓高性能存儲器向三維擴展而不是朝二維延伸;超算要與快閃記憶體結合,來改變電壓或頻率等節省功率;其次,可以採用包括能模擬大腦內神經元操作的神經形態電路或量子計算模式,創造出新型的計算機,比如生物計算機和量子計算機。

令人欣慰的是,我國正在通過多方面發力,讓超級計算機更節能環保。例如,曾獲中國專利獎優秀獎的「基於物聯網技術的數據中心動力環境監測系統」,採用超低功耗的無線數據採集技術、三維建模及虛擬仿真技術、智能分析技術等,有效消除了機房內局部熱點,解決了功耗特別大的難題,實現超算中心安全穩定和節能的目標。

相關焦點

  • 全球超算速度排名公布:中國神威太湖之光第三
    原標題:全球超算速度排名公布:中國神威太湖之光第三   據《日本經濟新聞》6月24日報導,在德國舉行的國際會議公布了全球超級計算機運算速度排名,美國橡樹嶺國家實驗室的「頂點(Summit)」繼2018年11月之後再次登上榜首。
  • 來認識一下中國的那些「超算」
    最新一期全球超級計算機500強榜單(TOP500)在第46屆世界超算大會期間公布。本期中國超算拿到了其中109席,份額佔比21.8%,在美國之後排名第二。其中中科曙光的超算系統入圍49臺,超過IBM公司的45臺。
  • 全球超算500強榜單出爐:日本「富嶽」蟬聯冠軍,基於ARM架構運算...
    全球超算500強榜單出爐:日本「富嶽」蟬聯冠軍,基於ARM架構運算性能破紀錄  Evelyn Zhang • 2020-11
  • 量子計算機「九章」問世:冷眼與嘲笑中,中國超算起步了
    1983年4月,日本電氣(NEC)公司正式發布了SX系列超級計算機,其中的高端型號SX-2成為世界上第一臺每秒運算速度超過10億次的超算,打破了超級計算機這一產品門類誕生二十年來美國人習以為常的「老子天下第一」認知。其後,SX-2更是成功出口美國,在「祖師爺」的地盤上打敗了本土廠商,直到1985年Cray-2超算的上市,才使美國人重新拿回"最強計算機"的榮譽。
  • 「光子晶片」運算速度,能超「石墨烯晶片」速度嗎?今天算明白了
    「光子晶片」運算速度,能超「石墨烯晶片」速度嗎?今天算明白了我相信如果你是一個非晶片研究領域的專業人員,你可能不知道其實我們現在所說的晶片,他其實有很多的種類,就像羰基晶片,光子晶片和量子晶片,你只知道他們是晶片卻不知道他們各自的性能是如何的。
  • 華為超算沸騰體 申威28nm超算晶片秒殺華為7nm超算晶片
    群裡有網友對這個話題討論,其實,用華為ARM處理器搭同構超算並不太合適,鐵流在這裡對持「厲害體」觀點的網友潑一盆冷水。華為鯤鵬920處理器浮點性能較弱雖然部分網友看到「1300萬億次」的數字很沸騰,但從性能來看,這臺超算性能並不強,神威太湖之光的性能為120+P,而1300萬億次是1.3P,相當於神威超算的百分之一左右,在全球TOP500超算中能夠排到300位左右。
  • 探訪美最新一代超算實驗室被問:是美國公民嗎?
    3月美國能源部宣布,美國首個「E級」新一代超算「極光」號2021年將在位於芝加哥的阿貢國家實驗室上線。超算保有量位居世界第一的中國將在2020年、日本將在2021年前後上線該級別的新一代機型。在中美高科技主導權之爭日益激化的情況下,決定未來國力的超算競賽的走向受到了各方關注。
  • 天河一號排名中國第一超算名不副實
    千萬億次(1PF)超級計算機是各國超級計算機領域共同追求的目標,隨著天河一號的發布,我國也加入了1PF俱樂部,相距加入百萬億次(100TF)俱樂部僅一年時間,比起美國的三年,看似光鮮了很多,但再看效率(見下表),高達1206PF的峰值運算速度居然只能跑出理論值一半都不到的
  • 揭秘算天,算地,算人,超算究竟有啥用?
    有人說,超算就是用來解決全世界在科技方面最難的問題的。超算究竟可以幹些什麼?8月7日21:50本周《對話》請來不同領域的人士,帶你領略超算那神一樣的計算速度,以及無比強大的實際用途。浪潮集團首席科學家 中國工程院院士王恩東:可以用三個字來形容超算,第一是快,第二是準,第三是狠。
  • TOP500最高能效比:NVIDIA「土星」超算排第一
    昨天發布的第48屆TOP500超算排行榜中,中國的神威·太湖之光以9.3億億次的Linpack性能繼續保持第一,實現了中國在TOP500排名中的八連冠了。
  • 浮點運算為什麼耗時很多?
    浮點運算就是實數運算,因為計算機只能存儲整數
  • 2019年世界超級計算機盤點,中美用E級超算決戰2020年
    超級計算機的核心技術除了CPU和 數學運算晶片以外,最關鍵的是讓這些CPU高效協同工作的互聯技術,這裡的高速互聯總線技術既有硬體又有軟體的創新,絕不是隨便買幾萬顆CPU隨便就能做出來的。超級計算機應用在需要密集數學計算的領域,比如天氣預報,石油,地質數據處理,飛行器空氣動力學仿真,乃至核爆炸仿真,新藥研發仿真等等。
  • 探訪鄭州「最強大腦」看超算如何「算天算地算人」
    中心負責人、河南省超級計算中心執行主任商建東介紹,作為全國第7家批覆建設的國家超級計算中心,鄭州中心配備了新一代高性能計算機,浮點運算峰值計算能力達到每秒10億億次,存儲容量為100PB,主機系統實測持續計算性能居國際同期前列。夠快是衡量超級計算機最「簡單粗暴」的指標,不過這樣一個超級「大傢伙」的日常維護費用同樣「不容小覷」,超算中心的耗電量已經成為業界「頭疼」的難題。
  • ARM 浮點運算詳解
    一:早期ARM上的浮點模擬器:早期的ARM沒有協處理器,所以浮點運算是由CPU來模擬的,即所需浮點運算均在浮點運算模擬器(float math emulation)上進行,需要的浮點運算,常要耗費數千個循環才能執行完畢,因此特別緩慢。
  • 未來科學發現可以「算」出來!專家呼籲推廣超算應用
    未來科學發現可以「算」出來!專家呼籲推廣超算應用「高性能超級計算機,是世界發達國家爭搶的重要『制高點』,對國家安全、經濟和社會發展,具有舉足輕重的支持作用。」我國超算實現「超常發展」「超算領域的競爭,就是科技實力與綜合國力的競爭。」
  • 那些追著超算跑的科學家
    那些追著超算跑的科學家來源:中國教育報 2016-11-19 蔣芳 蔡玉高  18日揭曉的「戈登貝爾獎」讓中國超算應用團隊成為世界矚目的焦點。他們成功背後有著怎樣的經歷與感受?追逐速度的意義是什麼?記者專訪了三支入圍該獎項的中國科研團隊研發人員。
  • 全球最快超算「富嶽」創造者松岡聰:下一代超算再快100倍!
    【新智元導讀】近日,全球目前的最快超算富嶽的創造者之一松岡聰接受了採訪,並表達了對於未來超算的一些看法。日本的富嶽超級計算機(Fugaku)去年6月在全球500強超級計算機排行榜上名列第一,這是大約9年來日本的首臺排名榜首的超級計算機。與一些競爭對手不同的是,富嶽超級計算機的創造目的不是為了超越數字基準。
  • 基於複數浮點運算的協方差矩陣的FPGA實現
    在充分應用FPGA並行處理能力的同時,為了擴展數據處理的動態範圍,減少數據溢出機率,避免數據截斷所產生的誤差,提高協方差矩陣的運算精度以及擴展該運算的通用性。本文以空間譜估計作為研究背景,研究了複數據運算和浮點運算的特點,提出了一種適用於任何陣列流型、任意陣元的基於複數浮點運算的協方差矩陣的FPGA實現方案。
  • 美國最快超算明年建成 速度超我國「太湖之光」
    據Futurism報導,在美國田納西州橡樹嶺國家實驗室(ORNL)的一個房間內,美國下一個速度最快、功能最強大的超級計算機正準備解決一些科學上的重大問題
  • CCF攜手中科院聚首國家超算深圳中心,共論E級計算機發展
    全球超算前五名分別為美國「Summit」、中國「神威·太湖之光」、美國「Sierra」、中國「天河二號」和日本「AI Bridging Cloud Infrastructure(ABCI)」。據了解,美國「Summit」使用了4608個計算伺服器,每個計算伺服器中又包括兩個22核的IBM Power9晶片和6個Nvidia Tesla V100 gpu,其浮點運算速度峰值達每秒20億億次(200PFlops),持續計算速度達到每秒12億億次運算速度。該系統具有超過10pb的內存,配以快速、高帶寬的路徑以實現有效的數據傳輸。