2010年底,我們曾經親身走進天津的國家超級計算中心,目睹了當時世界第一超算天河一號A的風採。世事變遷,性能堪比至少五個天河一號A的「泰坦」(Titan)又在美國的橡樹嶺國家實驗室(ORNL)裡屹立起來。接下來,我們就跟隨國外記者的腳步,一同去探秘這個新的全球超算No.1。(友情提醒:圖灰常灰常多喲……)
【從美洲虎到泰坦】
ORNL是美國能源部委託UT-Battelle公司管理的一個國家級核心科技研究基地,超級計算機只是他們的一個工具而已。上一代的「美洲虎」(Jaguar)建成於2005年,之後每年都在進行升級,泰坦則是一次超大規模的更新換代。
泰坦還是200個定製的19英寸機櫃和18688個計算節點,但已經更換為最新的Cray XK7計算系統,內部配置也大為不同:登陸與IO節點翻番為512個;處理器還是AMD Opteron,但是從12核心變為16核心,總的核心數量從224256個增加到299008個;每顆處理器搭配克卜勒架構的NVIDIA Tesla K20高性能計算卡,總計18688個GPU;系統內存每個節點原來是16GB,現在不但翻番為32GB,還有6GB GDDR5顯存,總量從300TB增至710TB;硬碟是一萬塊標準的1TB 7200轉2.5寸機械盤,總容量10PB,下次升級會增加到20-30PB。升級替換下來的老硬體照例都交還給Cray。
單單是CPU、GPU加在一起,整套系統就有177萬億個電晶體!
由於超算的大部分工作都是遠程執行的,泰坦內部還有幾十個10Gbps乙太網連結,還接入了能源部能源科學網絡(ESNET)的100Gbps骨幹網內。
而在峰值浮點性能方面,美洲虎「只有」2.3PFlops,泰坦猛增了幾乎十倍,超過20PFlops,也就是每秒鐘可進行2億億次計算。
全速運行的時候,它需要消耗900萬瓦特電力,典型負載下也要700萬瓦特,而這也是唯一限制它擴充的地方。為了減少供電線厚度,電壓是很高的480V而不是當地標準的208V。
泰坦的升級工作已經按時基本完成,並且立即就能投入科學計算工作,而且得益於Tesla計算卡的加盟,大量科學應用可以提速4-8倍。
至於泰坦是不是能夠成功拿下第一,要到半個月後的新一屆超算大會SC12上才會知曉,但就目前看來,已經是十拿九穩的了。