浪潮新「倚天」桌面超算NF5588實測報告_伺服器評測試用_太平洋...

2021-01-11 太平洋電腦網

 

  自2009年浪潮推出了國內首款萬億次桌面超級計算機——「倚天」以來,兼具低成本、高性能特點的「倚天」受到了廣大高性能用戶的普遍青睞。近日,浪潮 「倚天」寶劍再度出鞘,推出搭載了NVIDIA Tesla最新Fermi架構20系列GPU的升級版桌面超級計算機——NF5588。該產品採用目前業界最先進的雙路四核 CPU+GPU異構計算架構,是一款最高計算能力可達4萬億次每秒的高性能超級計算機,同時也是一款高端工作站產品。目前,NF5588已經成功應用於國防科技大學、西交大電信學院、井岡山大學等全國各大知名科研研究單位。

  本測試報告將利用分子動力學經典軟體NAMD及快速傅立葉變換FFT就這款產品進行全方位性能實測,同時針對上一代倚天桌面超算進行性能對比測試。


浪潮「倚天」NF5588

測試方案1:

  選擇典型高性能應用NAMD軟體及Nanopore算例來進行實測。NAMD是分子動力學領域最為經典及最早支持CUDA架構計算的軟體之一,它基於Charm++並行支持庫,實現了動態負載平衡,在高端硬體平臺上可以保持較高並行效率直到數千個處理器規模。Nanopore算例是通過分子動力學的方法,利用NAMD軟體進行模擬計算,對矽納米孔柱陣列的排列結構進行研究。

  本次對Nanopore算例進行10000個step的計算來進行計算時間對比。測試軟體是官網下載的NAMD_2.7b3_Linux-x86_64-CUDA.tar.tar與NAMD_2.7b2_Linux-x86_64-CUDA.tar.tar兩個不同版本。運行的命令為:./charmrun ++local +p8 ./namd2 +idlepoll +devices 0,2 /root/apoa1/apoa1.namd,其中+p參數指的是系統CPU運行的核數,+devices參數指的是系統GPU運行的設備號碼,此設備號碼可由CUDA SDK中的devicequery程序運行得來。

  測試方案1對比的是NF5588分別搭載Tesla C2050與Tesla C1060時的性能對比情況,對應Tesla C2050 GPU安裝了cuda3.1版本驅動,Tesla C1060 GPU安裝了cuda2.3版本及cuda3.1版本驅動,都分別對同樣的算例進行了測試,測試平臺配置信息及測試結果分別如下。

硬體

機型

Inspur NF5588

CPU

2*Intel Xeon E5520 @ 2.27GHz

GPU

2*Nvidia Tesla C1060

2* Nvidia Tesla C2050

內存

4*4G  DDR3  1333MHz

硬碟

500GB SATA

系統

OS

Red Hat Enterprise Linux Server release 5.4

驅動

CUDA

NVIDIA-Linux-x86_64-190.53-pkg2.run (cuda2.3)

devdriver_3.1_linux_64_256.40.run (cuda3.1)

 

NAMD版本

CUDA驅動版本

測試時間(秒)

NAMD_2.7b3_Linux

-x86_64-CUDA

2.3-drv

1*C1060

2*C1060

3*C1060

277.630463

156.488815

128.077164

3.1-drv

1*C1060

2*C1060

3*C1060

407.601776

221.654938

176.371780

1*C2050

2*C2050

 

205.011581

129.603073

NAMD_2.7b2_Linux

-x86_64-CUDA

2.3-drv

1*C1060

2*C1060

3*C1060

394.606384

216.176727

174.694672

3.1-drv

1*C1060

2*C1060

3*C1060

534.408508

287.990723

233.471939

1*C2050

2*C2050

 

357.576599

210.960190

  上表中的測試時間均為記錄系統運行算例的Wall Clock Time,由上表的數據分析可得出以下結論:

1. 驅動版本對性能的影響

  對於相同的軟體版本在不同驅動版本情況下的測試時間可知,在NF5588平臺上安裝cuda2.3驅動較cuda3.1的驅動對於C1060 GPU更適合(如下表),這是因為cuda2.3驅動是在Tesla 10系列的cuda架構下開發的;而Tesla 20系列的「Fermi」架構GPU,則需要 cuda3.1的驅動支持,不存在驅動版本的影響。

2. 軟體版本對性能的影響

  對比不同版本軟體運行時間可知,更高版本的軟體性能更優,這也是軟體逐步優化版本更替的結果。如下表中的提取數據,說明NF5588在搭載C1060時NAMD_2.7b3的運行時間較NAMD_2.7b2減少25%—30%;在搭載C2050時NAMD_2.7b3的運行時間較NAMD_2.7b2減少38%—43%。


3. 多GPU加速比的分析

  如下表,不難看出NF5588對於搭載多GPU的情況下,加速比值都不錯。


4. 搭載C2050與C1060的性能對比

  分別取兩個版本NAMD軟體在GPU卡適合的驅動(C1060取2.3driver;C2050取3.1driver)下得到對比圖表,及性能對比數據:

對比情況

1*GPU

2*GPU

2.7b3-3.1drv-C2050
VS
2.7b3-2.3drv-C1060

2.7b2-3.1drv-C2050
VS
2.7b2-2.3drv-C1060

2.7b3-3.1drv-C2050
VS
2.7b3-2.3drv-C1060

2.7b2-3.1drv-C2050
VS
2.7b2-2.3drv-C1060

性能提升

35.42%

10.36%

20.74%

2.47%

  從測試結果來看, NF5588搭載C2050對比搭載C1060,都有不同程度的提升,最好時能高出35%。但是受軟體版本及GPU運行數目的影響,性能提升略有不同。如受軟體版本影響,對於2.7b3版本的NAMD_CUDA軟體,在C2050對比C1060上的運行性能提升更高,說明新版本軟體對C2050新架構的支持更好。

測試方案2:

  快速傅立葉變換(Fast Fourier Transform FFT)在高性能的應用十分廣泛,它在聲學、電信、電力系統、圖像與信號處理、物探、天線、雷達、衛星 、醫療等應用領域有廣泛的應用。凡是可以利用傅立葉變換來進行分析、綜合、變換的地方,都可以利用FFT算法及運用數字計算技術來加以實現。

  CUFFT 是NIVIDA CUDA的快速傅立葉變換庫。是NVIDIA公司專為其CUDA架構計算設備開發的FFT加速庫。CUFFT庫支持以下功能:

可以對實數或複數進行一維,二維和三維的離散傅立葉變換。 可以同時並行處理一批一維的離散傅立葉變換;  對二維、三維傅立葉變換,每一維可以在[2,16384]中任意取值; 對一維傅立葉變換,能處理最大數組尺寸為8M; 對實數或者複數進行的FFT,結果輸出位置可以和輸入位置一致(原地變換),也可以不同(異址變換)。

  本次測試採用CUFFT庫版本:libcufft.so.3.0.14,測試分別在「倚天」NF5588(搭載Tesla C2050)和第一代「倚天」桌面超算上進行,對不同長度的信號(雙精度一維數組)先後進行正、負FFT變換,並截取FFT計算的精確時間,測試平臺配置如下:

 

對比平臺

升級版「倚天」NF5588

第一代「倚天」桌面超算

硬體

CPU

2*Intel E5520 @ 2.27GHz

2* Intel E5420 @ 2.5GHz

GPU

2* Nvidia Tesla C2050

2*Nvidia Tesla C1060

內存

16G  DDR3  1333MHz

8G DDR3

硬碟

500GB SATA

500GB SATA

系統

OS

Red Hat Enterprise Linux Server release 5.4

Red Hat Enterprise Linux Server release 5.4

驅動

CUDA

devdriver_3.1_linux_64_256.40.run (cuda3.1)

devdriver_3.1_linux_64_256.40.run (cuda3.1)

  對比測試結果如下:

Double  Inplace FFT  Batch enabled

signal_length

第一代「倚天」桌面超算

升級版「倚天」NF5588

性能提升

1024

0.24

0.247

0.971

2048

0.192

0.208

0.923

4096

0.216

0.212

1.019

8192

0.21

0.211

0.995

16384

0.27

0.248

1.089

32768

0.418

0.432

0.968

65536

0.792

0.44

1.800

131072

1.244

0.57

2.182

262144

2.161

0.865

2.498

524288

4.433

1.458

3.040

1048576

8.545

2.694

3.172

2097152

17.337

5.697

3.043

4194304

36.219

11.577

3.129

8388608

75.363

24.666

3.055

  隨信號長度的增加, 「倚天」NF5588的性能優勢明顯體現出來,當信號長度增加到最大8M(數組總大小為64MB)時, NF5588的cufft計算時間僅為第一代產品的三分之一。同時也說明「Fermi」架構的Tesla 20系列GPU在雙精度計算上較其上一代平臺有了較大性能提升。

測試結論:

  浪潮升級版「倚天」NF5588較上代產品進行了全面的升級,它支持NVIDIA Tesla最新的20系列GPU,採用雙路Intel Xeon 5500/5600系列CPU,及最新的DDR3 ECC Unbuffered/DDR3 ECC Register內存,最大容量可至48GB,並且具有更高的系統可靠性、更強的海量存儲能力、更強I/O擴展能力及更卓越的散熱技術。

  一系列的實測證明了NF5588超強的計算能力,它的計算能力甚至超越了一個小型的高性能集群,浪潮高性能產業將繼續努力滿足HPC行業對性能無休止的追求,努力滿足HPC應用對計算能力最苛刻要求,努力使浪潮的HPC產品勝任於包括生命、金融、證券、動漫、電信、大中型企業、能源等各種關鍵性應用。

相關焦點

  • 浪潮「倚天」桌面超算——Matlab實測報告
    在這樣CPU+GPU異構運算平臺異軍突起的時代,浪潮率先發布了業界首款萬億次桌面超級計算機——「倚天」(以下簡稱浪潮「倚天」)。浪潮「倚天」桌面超級計算機採用CPU-GPU協同計算加速架構,在相當於普通PC伺服器的體積上提供了萬億次的計算性能,為大量數據並行處理、計算密集型應用提供了一種全新的超高性價比的解決方案,為科學工作者提供了桌面級的綠色、環保的個人超級計算機。
  • 高效機架伺服器 浪潮 NF5280M3報12900元
    【PConline廣州站 行情】浪潮 NF5280M3伺服器基於最新的計算技術全新設計的一款高端雙路機架式伺服器,具有高效、可靠、智能、高擴展特性,適用於各類對計算、存儲、通訊有高標準要求的關鍵應用。
  • 高配機架式 浪潮NF5270M4伺服器現售64900
    【PConline山東站 行情】浪潮 NF5270M4(E5-2620v3/8G/300G*3/24×HSB)基於英特爾最新平臺的E5-2620 V3處理器,相比上一代多出50%的內核與高速緩存,大幅提升處理器性能
  • 浪潮助中國基因測序產業化_浪潮伺服器_伺服器解決方案...
    近日,中國最大的伺服器廠商浪潮為國產基因測序儀廠商中科紫鑫設計構建了高性能計算集群,用於提供面向全國的基因測序分析雲服務。據悉該集群將可承擔20到40臺新一代國產自主基因測序儀在全國範圍試運行期間的所有測序分析服務。
  • 智能化E5平臺 浪潮NF5280M3伺服器評測
    隨著新一代至強E5系列處理器的推出,雖然平滑升級的特性可以讓伺服器提供商們在原有平臺進行升級,迅速推出新的產品,但為了更加契合至強E5的新特性,浪潮推出新一代智能化E5平臺英信NF5280M3伺服器。  作為針對至強E5-2600平臺的助推產品,浪潮在研發NF5280M3可謂是浪潮新一代的旗艦產品,新伺服器突破了以往國產品牌產品的軟肋,在產品設計細節、工藝、規格定義、功能性能方面有了很大的提升,採用最新的英特爾至強處理器E5-2600系列,具有強勁的性能表現,相比上一代產品,多方面性能提升至少30%。
  • 向雲而生 浪潮2U4路伺服器NF8260M6
    正是在這樣的背景下,浪潮開始開發專為雲計算優化的伺服器,並把目標放在了四路伺服器上。四路伺服器的雲化使原本用以關鍵計算的伺服器有機會走入新興的大規模網際網路應用中,滿足網際網路企業在高速發展過程中對計算力的需求,同時也把原來面對關鍵應用的可靠性、穩定性的設計思想和方案進行傳承和推廣。
  • 浪潮擁有全球領先的AI伺服器陣列
    浪潮擁有全球領先的AI伺服器陣列 2020年07月10日 14:10作者:黃頁編輯:黃頁 浪潮在本次競賽中表現出色,在10個單項競技中取得了1個單項第一、1個單項第二和3個單項第三的好成績。 浪潮開發了全流程AutoDL解決方案,涵蓋自動數據處理,自動模型構建、自動超參數優化等核心組件。
  • 拋出智算中心概念,浪潮要給智能社會新基建添磚加瓦
    當智慧計算佔比已經過半時,對新形態數據中心的需求就變得日益強勁。從AI伺服器這一新興伺服器類目的崛起,也能看到AI計算需求的蓬勃,IDC報告顯示2019年上半年中國人工智慧基礎設施市場銷售額達到8.37億美元,同比增長54.1%。IDC另一份報告則顯示,未來五年中國人工智慧伺服器市場複合增長率將超過30%,增速是伺服器市場整體增速的三倍。
  • 華為超算沸騰體 申威28nm超算晶片秒殺華為7nm超算晶片
    群裡有網友對這個話題討論,其實,用華為ARM處理器搭同構超算並不太合適,鐵流在這裡對持「厲害體」觀點的網友潑一盆冷水。華為鯤鵬920處理器浮點性能較弱雖然部分網友看到「1300萬億次」的數字很沸騰,但從性能來看,這臺超算性能並不強,神威太湖之光的性能為120+P,而1300萬億次是1.3P,相當於神威超算的百分之一左右,在全球TOP500超算中能夠排到300位左右。
  • 計算力就是生產力 淺析浪潮智算中心的多維價值
    當前,計算產業已然面臨新的增長機遇。我們都知道數據中心、超算中心,那麼智算中心是什麼?得益於豐富的行業實踐和敏銳的行業洞察,浪潮提出了智算中心這一前瞻性概念,智慧時代需要新型基礎設施,而智算中心將成為智慧時代的基礎設施。
  • 心算、珠算到超算 計算「極限」該如何突破?——世界計算機大會新...
    新華社長沙9月11日電 題:心算、珠算到超算 計算「極限」該如何突破?——世界計算機大會新觀察新華社記者從心算、珠算的「古老智慧」,到「銀河」「天河」「神威」創造「中國速度」,「中國計算」為世界矚目。
  • 浪潮英信 NF5280M5濟南特價 濟南伺服器
    (中關村在線 濟南行情)浪潮 英信 NF5280M5(Xeon Silver 4114*2/16GB*4/900GB*3),近日在經銷商山東雲海世紀浪潮分銷商促銷,聯繫電話:13370551711 / 15011190267
  • 全面提升 浪潮NF5270M4伺服器報40900元
    (中關村在線廣州辦事處)作為國產品牌,浪潮雙路伺服器平臺NF5280M4採用英特爾至強E5-2600 v3系列處理器,憑藉其22納米工藝新一代Haswell架構處理器的誕生,讓浪潮NF5280系列經典產品不僅平滑升級優化,新一代產品更多在設計和優化上符合新一代至強E5 V3的新特性。
  • 浪潮伺服器NF5466M5 智慧視頻存儲伺服器新選擇
    浪潮新一代存儲伺服器NF5466M5浪潮發布的新一代存儲伺服器NF5466M5就是針對人工智慧時代的視頻應用設計,通過靈活的配置,可以覆蓋視頻識別、視頻存儲、視頻備份等各類視頻應用場景,並且單位空間的處理性能和存儲密度進一步提高,滿足了現代雲數據中心的部署需求。
  • 心算、珠算到超算 計算「極限」突破 6股熱
    心算、珠算到超算 計算「極限」該如何突破?——世界計算機大會新觀察新華社長沙9月11日電 從心算、珠算的「古老智慧」,到「銀河」「天河」「神威」創造「中國速度」,「中國計算」為世界矚目。計算機技術「極限」該怎麼突破?如何迎接「產業變革」?未來計算機又將走向何方?
  • 28核56線程至強鉑金8276M 寶德自強PR2710P伺服器評測
    無論是雲計算、大數據,亦或是近兩年興起的人工智慧,新一輪技術的發展均離不開算力作為支撐。    性能實測:鉑金8276M恐怖的計算性能    為了更直觀展現寶德自強PR2710P伺服器的性能,本次評測也藉助CineBench R15、SiSoftware Sandra、IOMeter等軟體對CPU、內存及磁碟進行了實際評測。
  • 浪潮王恩東:AI準確度也是算出來的
    本屆大會以「計算,預見AI未來」為主題,參會者超過2000人,包括來自中國工程院、英國皇家工程院、中國新一代人工智慧發展戰略研究院等學術機構的專家學者,以及Facebook、Uber、Intel、NVIDIA、VMware、百度雲、阿里雲、浪潮、廣汽研究院、吉利汽車研究院、寒武紀、IDC、SPEC組織等數十位AI知名公司與研究機構技術主管、資深工程師,會議議題涉及晶片
  • 來認識一下中國的那些「超算」
    最新一期全球超級計算機500強榜單(TOP500)在第46屆世界超算大會期間公布。本期中國超算拿到了其中109席,份額佔比21.8%,在美國之後排名第二。其中中科曙光的超算系統入圍49臺,超過IBM公司的45臺。
  • 數據驅動第五波計算浪潮 Arm伺服器產業迎來新一輪機會
    打開APP 數據驅動第五波計算浪潮 Arm伺服器產業迎來新一輪機會 發表於 2019-05-06 15:07:16 數據驅動第五波計算浪潮 Arm伺服器產業迎來新一輪機會 放眼當下,以智慧型手機為代表的行動裝置產業發展邁入「下半場」,雲計算、物聯網、人工智慧等新興技術的登場,推動了萬物互聯、萬物感知的智能社會建設,從而對綠色計算、智能計算提出了多樣化、迫切的需求。
  • 浪潮承建南京大學超算系統 助研精細化數值預報
    1比16,天氣預測精度和超算性能之間的博弈一般來說,天氣預報的準確度依賴於氣象數值模式的解析度。解析度的數值是指該模式能預測多少範圍內的天氣變化,解析度的數字越小表示能預測的範圍越精細,越能為突發天氣災害、百姓日常出行提供準確的天氣依據。