華為超算沸騰體 申威28nm超算晶片秒殺華為7nm超算晶片

2021-01-07 鐵流

日前,媒體報導由華為1300萬億次高性能計算平臺在瀋陽落地,在航空工業氣動院(以下簡稱「氣動院」)投入使用。群裡有網友對這個話題討論,其實,用華為ARM處理器搭同構超算並不太合適,鐵流在這裡對持「厲害體」觀點的網友潑一盆冷水。

華為鯤鵬920處理器浮點性能較弱

雖然部分網友看到「1300萬億次」的數字很沸騰,但從性能來看,這臺超算性能並不強,神威太湖之光的性能為120+P,而1300萬億次是1.3P,相當於神威超算的百分之一左右,在全球TOP500超算中能夠排到300位左右。

就華為鯤鵬920來說,其實並不適合用來當超算晶片。媒體報導,「在SPECint基準測試中,鯤鵬920得分超過930分,比行業基準高出近25%,同時功耗降低30%」,報導中的意思是鯤鵬920性能強悍所以用來建超算。但實際上,SPECint基準測試測的是定點性能,而超算看重的是雙精度浮點性能。而浮點性能恰恰是鯤鵬920的弱項。

而就浮點性能來說,恰恰是鯤鵬920的弱項。根據上海X大PPT,鯤鵬920 TDP 150W,雙精度浮點算力384Gflops(@2.6G)。

申威超算晶片在性能功耗比和絕對性能上優勢明顯

根據成都申威官網數據,申威1621主頻2GHz時的雙精度浮點性能可高達512GFlops,TDP 150W。

如果拿SW26010作為比較差距就更大,SW26010的雙精度浮點性能為3TFlops,功耗為200W。

只有用神威藍光超算(2011年)的申威1600做對比,鯤鵬920才能找到少許安慰——申威1600,16核,製程65nm,1.1G主頻,功耗50至60W,雙精浮點140GFlops。

必須說明的是鯤鵬920是7nm工藝,而SW1621和SW26010是28nm工藝,而SW1600是65nm工藝,鯤鵬920在採用7nm工藝的情況下,雙精度浮點算力的性能功耗比還不如SW的28nm晶片。在絕對峰值性能上,與上一代SW20610差距非常明顯。與用在神威E級原型機上的申威超算晶片差距就更大了。

目前的ARM伺服器CPU屬於劍走偏鋒

一位實測了鯤鵬920機器的朋友評價:

鯤鵬920浮點本來就不行,cpu2006就低很多,向量就更差了,才128bit,自然不能跟256/512bit的比,浮點,intel無疑強很多,arm的等sve普及吧,現在不行。但是SPECint_rate鯤鵬920就是最強arm沒問題啊。

目前,國內的ARM伺服器CPU都屬於劍走偏鋒的產物,比如在單核性能和英特爾有差距的情況下,堆64核心,獲得較高的SPECint_rate成績,通過64核戰英特爾14/28核的方式,在PPT上吊打英特爾。

即便是ARM廠商經常掛在嘴邊的低功耗,也是有投機取巧的成分。在CISC和RISC已經殊途同歸的情況下,指令集對CPU功耗的影響已經微乎其微,CPU設計水平和製造工藝才是影響功耗的最關鍵因素。因而一些ARM廠商玩「ARM=低功耗」的說辭是值得商榷的。

何況鯤鵬920的浮點性能是比較弱的,而英特爾的浮點性能比較強,以鯤鵬920這種「閹割」了浮點性能的CPU,與英特爾「大而全」的CPU比功耗,同時在性能上只比定點性能,不比浮點性能,而且鯤鵬920是臺積電7nm工藝,英特爾則是14nm工藝,通過這種方式在PPT上獲得對英特爾的功耗優勢,這種對比方式有一些投機取巧了。

就商業上來說,從性能、功耗、生態、價格等因素綜合考慮,英特爾是吊打全球各家的ARM伺服器CPU。有用戶單位在少量試用ARM伺服器後就抱怨單核性能不行,白花冤枉錢。某種程度上,國內的64核ARM伺服器是急功近利、劍走偏鋒的產物。應當先把單核定點和浮點性能都提升上去再去做多核。

新聞裡潛藏的亮點是氣動院開發或移植應用

近年來,中國超算性能突飛猛進,但在應用方面也取得了長足進步,屢次斬獲戈登貝爾獎,但依然和國外有一定差距。而ARM超算還屬於新鮮事物,因而整套流體力學的軟體很有可能是氣動院自己開發或移植的,這是不少網友忽略的一個亮點。

可以說,氣動院開發一套流體力學軟體在神威超算上跑也沒問題,用飛騰2000系列CPU組一個同構超算跑這套應用也沒問題。之所以用華為的鯤鵬處理器,估計和最近華為在輿論上封神,獲得了很多國家資源傾斜和扶持有關。當然,估計也和ARM伺服器CPU在商業上被英特爾吊打,因而華為竭力想推一些應用案例有關係,即便鯤鵬920並不適合用在同構超算上,反正先推出去再說。

鯤鵬920的強項是SPECint_rate成績較好,以及集成的I/O功能和網卡很強,華為應該把應用的方向聚焦在對單核性能要求不太高,且對定點比較看重的應用。用來搭建同構超算非其所長,由於雙精度浮點性能有限,用來做超算堪稱事倍功半。

相關焦點

  • 華為聯手中科大鑄就高校超算新標杆
    「你去超算中心啊,他那邊跑的快很多。」「我之前試過,那邊排隊太長了,比我們實驗室快不了多少。」「現在他們新買的華為HPC平臺,規模比之前大了很多,作業周轉快基本不用排隊。而且I/O特別快,算我們這種作業快得不要不要的。」「真的嗎?那我們一起吃飯,最近天天晚去吃剩飯都快不行了。回來我趕緊試試華為的平臺。」
  • 「光子晶片」運算速度,能超「石墨烯晶片」速度嗎?今天算明白了
    「光子晶片」運算速度,能超「石墨烯晶片」速度嗎?今天算明白了我相信如果你是一個非晶片研究領域的專業人員,你可能不知道其實我們現在所說的晶片,他其實有很多的種類,就像羰基晶片,光子晶片和量子晶片,你只知道他們是晶片卻不知道他們各自的性能是如何的。
  • 二代IPU:怎樣做一顆秒殺超算的晶片?
    擴展至1024個IPU-POD,即512個機架,至多64000個MK2晶片集群之後,其16bit FP算力能夠達到16 ExaFLOPs.kP5EETC-電子工程專輯在上周的媒體分享會上,Graphcore高級副總裁兼中國區總經理盧濤還提到,「日本前一陣發布了超算,做到0.5 ExaFLOPs的算力」。
  • 比拼浮點運算速度 超算排行榜是這樣「算」出來的
    6月17日,新一期全球超算500強榜單出爐,入選500強的所有超算浮點運算速度都突破每秒千萬億次,中國超算也在前四佔有兩席位置。普通計算機用指令運算速度衡量計算性能,而超算通常用浮點運算速度來衡量其性能。那麼,什麼是浮點運算速度,超算榜單為什麼會選擇浮點運算速度來進行比較?
  • 來認識一下中國的那些「超算」
    最新一期全球超級計算機500強榜單(TOP500)在第46屆世界超算大會期間公布。本期中國超算拿到了其中109席,份額佔比21.8%,在美國之後排名第二。其中中科曙光的超算系統入圍49臺,超過IBM公司的45臺。
  • 全球「超算」500強, 美國113臺, 日本34臺, 中國有多少!
    超算500強名單出爐  今年11月全球「超算」500強榜單公布,第一名依舊是日本的富嶽超級計算機。  同時富嶽超級計算機也是第一個使用ARM架構進入500強名單的超算,一進來就排在第一,這讓不得不讓大眾重新審視AEM架構。
  • 光子晶片咋樣?算力1000倍,能耗1%,彎道超車?不服就幹
    導讀:光子晶片已經產生了突破,原型晶片已經做出,後面就是解決製作工藝問題,由於其算力超高,所以對於加工精度要求就低,一旦突破,從設計到製作,國內可以自己完成,拜託對外國的依賴。而光速最快、並且光子也能形成0-1變化,所以光子晶片、光子計算機都成為可能。不光是中國,在全世界都為半導體的製造發愁,半導體晶片在1.5nm製成工藝形成瓶頸,再往下發展會形成瓶頸。光子晶片大幅度提高算力的情況下,在相同面積下,不用集成那麼多器件,所以加工精度要求就降低了。但是之後可能會在光子晶片這個賽道重新比賽,加工精度重新提高。
  • 全球超算風向已變 GPU引領加速計算時代
    本周(11月12日-17日),全球超算大會SC17在美國丹佛舉行,超算大會被看作是全球超算的風向標之一,從超算大會去洞察出全球超算當下及未來的發展趨勢是絕佳的選擇。 在前線參會後的感受是,全球超算市場正式迎來人工智慧時代,在這個巨大的趨勢下,中國勢力與加速計算正在成為兩大主旋律。
  • 華為需要的晶片為啥國內造不出?解密30年中國晶片史
    近兩年來,華為飽受某國的技術封鎖和晶片禁運,致使華為的麒麟晶片的自研進程被迫擱淺,華為最新的搭載麒麟的P40成為絕唱在晶片問題上,中國一直受到某國的掣肘,主要體現在晶片製造上,在晶片製造技術專利中,美國一直領先全球,致使全球最先進的晶片製造商荷蘭公司阿斯麥爾也不得不使用美國的技術來製造光刻機在美國對華的技術封鎖中
  • 超算奪冠且行且近,勢在必行
    處理器:10,649,600 個;峰值速度:125,436 TFlop/s簡介:之前四屆top500排名中,我國的神威 「太湖之光」超級計算機都是冠軍,全部使用中國自主智慧財產權的晶片「天河」系列超算已經全面掌握五大自主核心技術,即具有自主智慧財產權的四大晶片和自主作業系統,所有核心技術和產品均不再被國外「卡脖子」。而神威E級超算原型機在國家超級計算濟南中心完成部署,並正式啟用。這距離「天河三號」E級原型機在國家超級計算天津中心通過項目課題驗收剛剛過去兩周。除「天河三號」、神威E級之外,中國三大「超算軍團」裡還有中科曙光。不光中國,歐洲也啟動相應的項目。
  • 算力利用率超90%!地平線推二代邊緣晶片,詳解AIoT落地綜合打法
    一邊是華為、百度、阿里等科技巨頭和幾家獨角獸輪番秀出雲端AI晶片新進展,另一邊聚焦於邊緣與終端的多家AI晶片創企陸續登場,揭開其第一代或者最新一代晶片的神秘面紗。與此同時,人們評判AI晶片的標準,也由看算力、功耗等硬指標,轉向看量產規模、看客戶、看生態。這不,國內AI晶片落地的排頭兵地平線,剛剛亮出新劍!
  • 「走進溪村」2020超算中國高峰論壇舉行,開啟融合智算雲新時代
    來源:時刻頭條12月5日,「走進溪村」2020超算中國高峰論壇(華為站)成功舉行。在科技部指導下,本次高峰論壇由CCF高專委、華為雲、鵬城實驗室聯合舉辦,以「新基建、新超算、新經濟開啟融合智算雲的新時代」 為主題,旨在新基建背景下,基於超算、雲,AI、HPC、大數據等新興數位技術融合,碰撞出「政產學研用」相結合的思辨創新。從而助力更多行業獨角獸的孵化,賦能千行百業,真正推動科技進入企業場景的轉型升級。
  • 如何從一顆沙子變成晶片:談 談華為功臣麒麟晶片發展史
    集成GC4000的GPU,40nm製程工藝, 這款晶片得到了華為手機部門的高度重視,直接商用搭載在了華為P6和華為Mate1等產品上面,可謂寄予厚望,要知道當初華為P6是作為旗艦產品定位。 但由於其晶片發熱過於嚴重且GPU兼容性太差等,使得該晶片被各大網友所詬病。但華為頂著壓力堅持數款手機採用該晶片,當時華為晶片被眾人恥笑,接下來華為開始了自己的刻苦鑽研。
  • 6位院士齊聚 中國超算硬實力 2020CCF年會鄭重召開
    "最近5年中國的超算有著飛快的發展,超算運力的發展牽動著國家整體科技水平的發展。超算能力甚至可以代表一個國家的未來發展能力"。超級計算設計的不只是一個部門、一個學科的運用。包括化學、生物、生態、物理等多層面、多領域、多行業的發展,這種發展體現的是國家科學知識能力的能力高低,也必須依賴於超算領域的發展。在如今國際科技競賽形態日漸激烈的今天,超算能力的高低基本可以代表一個國家科學領域研究發展的水平。隨著各專業對科學模型搭建、分析,研究、開發等需求,超算領域也成為了一個剛需要,一個國家發展的核心競爭力。
  • 華為發布全球首款5nm手機晶片
    10月29日,華為面向全球正式發布新一代旗艦手機晶片麒麟9000,這是業界最高集成度5nm 5G SoC。 這個視頻展示麒麟晶片十年奮鬥史 華為Fellow艾偉在媒體溝通會上全面解讀了麒麟9000。
  • 打破晶片壟斷的希望:量子科技碾壓傳統超算,未來15年世界領先
    量子計算:未來量子計算將會是我們打破摩爾定律的鋒利之矛,同時也將是打破晶片壟斷、實現彎道超車的技術。那量子計算的算力有多強呢?例一、量子計算機100秒完成的計算,全球最大的超算Summit要花5000多年,這是量子的特性所決定。
  • 「晶片」真的是越小越好?看看7nm和10nm的晶片,差距到底多大?
    現在是科技的時代,我們的生活中融入了很多的智能設備,然而科技感滿滿的設備都只需要幾枚小小的晶片,晶片也是現在各國的非常重點的項目。眾所周知,晶片都是製作的越小越好,據了解,晶片是由電晶體組成的,製程越小,同樣面積的晶片裡,電晶體就越多,自然性能就越強了。
  • 華為迎轉機?2.6萬億晶片板塊迎重磅利好
    華為迎轉機?2.6萬億晶片板塊迎重磅利好,聰明資金加倉的滯漲晶片股出爐,最高上漲空間超50%作者:數據寶 張娟娟中芯國際工藝獲突破,這些滯漲晶片股有望受益。美國對華為的「制裁」一直未間斷過,毫無疑問,麒麟9000是國產自主研發晶片的巔峰之作,這款晶片可以說是臺積電頂著美國的重重壓力為華為代工的。早在10幾年前,華為就決定要自主研發晶片,主要就是為了防止美國斷供,只是沒想到這一天來得這麼早。華為芯是否存在轉機?
  • 【融資】華為哈勃投資碳化矽外延晶片供應商瀚天天成,認繳出資額超...
    【融資】華為哈勃投資碳化矽外延晶片供應商瀚天天成,認繳出資額超977萬元;萬業企業旗下凱世通集成電路離子注入機,多款型號設備獲得訂單;2025年全球AI晶片市場規模將達700億美元
  • 從28nm到7nm秒懂麒麟晶片進化史 華為:8月31發布麒麟980
    8月31日,華為要在德國正式發布新一代麒麟處理器,從目前公布的消息來看,新的處理器就是麒麟980,並且要全球首發7nm工藝。   對於即將發布的麒麟980,華為在宣傳上也是十分的賣力,並強調新的處理器會在CPU/GPU/NPU上都有大的提升,特別是AI人工智慧上提升。