超級計算機與人工智慧:大國超算,無人領航

2020-12-22 騰訊網

圖片來源@視覺中國

文丨譚婧

美國先有星球大戰計劃,中國後有「863」計劃。

1986年底,年過四十的李國傑從美國回到中國, 成為中國科學院計算技術研究所的一名研究員。

他就是後來的「曙光一號」研發之父。

1990年3月,北京友誼賓館,國家智能計算機中心宣布成立。

那一年,李國傑組織了一支很特別的隊伍,其中的大部分人沒有造過計算機。

李國傑認為,不理解作業系統源程序,是不可能造出計算機的。於是,他們花了兩年時間,分析了幾百萬行的代碼,一行一行地摳。

信仰不能鬆動,鬥志不能鬆懈,辦場誓師大會鼓鼓勁兒。

「人生能有幾回搏」 幾個大字寫在黑板上。誓詞在發黃的紙頁上褪色,有句話壓在了肩膀上:「相信你們一定能做出來!」

有人紅了眼圈,有人眼中帶淚。

夜夜龍泉壁上鳴,無數個趴在鍵盤上睡著了,手裡還緊緊握著滑鼠的凌晨四點。誓言像鬧鐘一樣叫醒大腦。

個體的幸福是有限的,人們常常是和國家、和時代一起同苦同樂。

1996年,以「863」計劃的重大成果曙光一號為智慧財產權,曙光信息產業有限公司成立。

「曙光」帶給人希望,「龍芯」很有中國味。

作為國產晶片,「龍芯」出發時,來自中國科學院計算技術研究所的胡偉武,前來請戰。

他是後來的龍芯CPU首席科學家。

他說:「我做不出龍芯一號,提頭來見。」

你知道什麼能讓你覺得輸也沒什麼嗎?

贏。

01

1999年前後的行情是,價格在10萬元人民幣以上的計算機,才能被稱為高端計算機,或者高性能計算機。

而很多情況下,高性能計算機又被稱為「超級計算機」。

超級計算機的評價標準是水漲船高的。

穿過時光隧道,把你手上的iPhoneX拿到1960年,以它的計算能力,也可以叫超級計算機。

超級計算機,是計算系統金字塔的頂端。

超級計算機的應用,是用最複雜的計算機,突破最難問題。

如果還不清楚,那再加一句:

超級計算機如同核武器一樣,有與無,天壤之別。

從頭開始已無可能,集成創新用腳步丈量距離。

總有人,對集成創新嗤之以鼻,唯有原始創新才是英雄兒女。然而,創新不能一刀切,把已有科技成果有機地結合起來也有難度。

還有一點就是,在當時的情況下,能選擇的路,並不多。

有的人做技術,做了幾十年還是在做殼子。

有的人做技術,做著做著,皮肉筋骨都變成了自己的。

2010年,曙光6000研製中,採用龍芯3A實現了一部分,但並不是主要部分。

2011年,神威藍光問世,這是以國產多核CPU晶片為基礎的第一臺超級計算機。

這代表著:只能用國外晶片生產超級計算機的歷史結束了。

超級計算機的賽場,永遠不會止步於在榜單上,止步於實驗室「無菌」環境裡。

上世紀九十年代的深圳,李國傑院士留意到:

「有一家叫華為的公司,七八百號人搞研發,每年投入的研發費用超過一個億,其產品有競爭力應在意料之中。」

時光催迫,又十年。

2003年12月的一個早晨,熱帶的陽光在給清涼的沙粒加熱,兩位身穿色彩明亮的椰樹風襯衫的中國人和一位身著運動服的外國人,漫步在海南島的沙灘上,聊得很是投機。

其一是時任摩託羅拉營運長邁克•扎菲羅夫斯基,另一位是時年59歲的華為創始人任正非。

沙灘漫步的結果是,摩託羅拉同意以75億美元收購華為。然而,劇情急轉彎,收購流產了。

此後,摩託羅拉與華為這兩位時代巨子駕著不同命運的馬車絕塵而去,一路狂奔的還有華為鋼鐵一般的,自研技術決心。

李國傑院士回憶,2003年的時候,華為支持大學和科研院所做預研的資金曾經連續兩年減少。究其原因,大學和科研院所與華為做的在同一層次,而且不如他們做的好。

這事曾讓李國傑院士捫心自問:像(中科院)計算所這樣的國立科研機構究竟該做什麼研究?

日月輪轉,又五年。

2008年3月,華為與賽門鐵克公司(Symantec)的合資公司成立。為此,華為派出約4000-5000名精兵強將,而賽門鐵克派出的僅僅是三位外籍高管。我探訪到了一位接近女高管的人士,他提到了一些往事細節。女高管常駐香港,定期飛成都。

這也印證曾有華為員工提到的,華為負責存儲的高管大多在成都。

「合作很順利,賽方不需要高管蹲守成都。」匿名受訪人的原話。

賽門鐵克這家公司,在信息安全領域全球領先。這場合作,各取所需。一家外國企業「借道」華為發達的銷售網絡,進軍中國市場。

這場「共同研發」為華為存儲技術打下堅實基礎。

任正非曾說:「華為跟著人跑的機會主義高速度會逐步慢下來。」

這也暗合中國高端計算機發展之路。

02

臺北101大廈直插雲際,俯瞰生機勃勃的城市。

2014年的最後十幾天,浪潮集團臺北研發中心在101揭牌。

臺灣是晶片的高地,晶片製程工藝長期領先,坐擁大批核心高端人才,IT設備代工王者雲集,排名前10位的代工廠有,廣達、緯創、仁寶……

歲月易逝,這些臺資代工廠的合計份額一度超過90%,訂單來自IBM、戴爾、惠普……

那時候,浪潮想得很清楚,借力我們的臺灣,重金獵聘。

於是,一批技術功底紮實的臺灣科技人才投入浪潮的懷抱。下好這一步棋,浪潮伺服器設備水平實現了三級跳式的跨越。

在這件事上,浪潮集團董事長兼CEO,山東企業家孫丕恕,顯露出高瞻遠矚的決策力。

猛將必發於卒伍,宰相必取於州郡。歷史性的腳步,都在時間的長廊裡留下了迴響。

如果說超級計算機是發動機,千行百業就是汽車,得裝進汽車裡才知道它的性能。

以前,超級計算機主要用於科學研究,核爆模擬、氣象氣候、生物信息計算等。而每一種科學問題,都有其固有的特性(並行性),這也意味著重複「堆機器」永遠無法具有「超級計算」的霸氣。

再加之,不同應用對超算的需求迥異,不做艱苦研究與科技創新,肯定沒戲。

苦苦研究就夠嗎?

答案是,超算不能光靠研發「推」,得讓需求「拉」。

曾有人把拉力不足歸因為我國生產力落後。仿真工業產品性能,也要工業部門能用得上。1999年,國內有一家飛機公司的總工,一度完全不相信波音777沒有一張紙質圖紙。

仿真驅動研發,數值模擬技術瘋狂地縮短研製周期,簡化、減少甚至取消實物試驗。

超級計算機是否只能用在大型工業產品研發中呢?

一場美國學術會議上,樂事薯片公司出現在演講臺上。這並不是中場茶歇廣告贊助商的致辭,而是如何用超級計算機模擬薯片生產中的空氣動力學。

鹽放哪裡都鹹,醋放哪裡都酸。

如何把薯片上的調料撒均勻?好吃的秘密是數值模擬的結果。超級計算機藏在刷劇、吃薯片的肥宅時光裡。

年曆翻到2016年,中國超算人擦乾汗水、抹掉淚水,終於迎來高光時刻。

中國隊2016和2017年連續兩次奪得「戈登貝爾獎」,這是國際上的最高學術獎,江湖人稱「超算界的諾貝爾」。

此前的近30年,此獎就在美國和日本間「拋繡球」。

如今,不僅「天河」、「曙光」、「神威」等超級計算機,使國家級超級計算基礎設施進入世界領先行列,而且,從《2019中國HPC TOP100廠商份額趨勢圖》中可以看到,中國廠商超過了高性能計算領域的「傳統勁敵」,IBM和惠普。

03

2020年,彎眉冷月,仲秋月圓。

綠皮火車停靠首都經濟圈城市河北衡水,神州高鐵抵達中原城市群落的中心河南鄭州。

在2020年中國超級計算領域兩場重量級的會議上,這些聲音樸素、結實、鮮明。學界與工業界一呼一吸。

在「十三五」國家重點研發專項「高性能計算」總體專家組組長、北京航空航天大學錢德沛教授首發演講的七天後,一位華為高管便在演講時引用了他的觀點,並標明信息來源為「衡水講話」。

圖片:衡水車站,攝影:譚婧

這場演講,題為《新形勢下高性能計算發展面臨的挑戰和任務》

全球高性能計算機(HPC)TOP500榜單歷時已久(從1993年開始,每年的 6 月和 11 月發榜)。

作為風向標,反映了超級計算機發展的新動向。排行榜的變化折射出全球高性能計算在技術和應用方面的研究現狀和發展趨勢。

回首發展的曲線,2013年成為這個榜單顯著的分水嶺。在此之前,榜單上排名第一位的超級計算機性能和上榜計算機的總體性能,一直呈現出這樣一個趨勢:超級計算機的性能每十年到十一年,提高一千倍。

從2013年開始,上升的曲線變得平緩,甚至於在2019年11月,TOP500榜單的前十名和前一次相比沒有發生變化。

如果沒有革命性的技術突破,超級計算機性能不可能再保持十年一千倍的發展速度,而有可能降到十年一百倍,或者更低。

發展之所以變緩,從技術角度觀察,是遇到了一些瓶頸。

《新形勢下高性能計算發展面臨的挑戰和任務》

第一、能效指標的約束,不能單純依靠系統並行規模的擴大來提高性能。

第二、登納德縮放比例定律 (Dennard Scaling)的失效。每一代半導體工藝的進步不再能保證晶片功率密度的恆定,其結果是晶片功耗急劇上升。

第三、摩爾定律接近失效,晶片性能不再能每兩年翻一番。

第四、體系結構變化緩慢,沒有新的體系結構提出。在顛覆性技術方面沒有新的技術出現,包括經常談到的量子計算、超導計算,距離實用還有相當一段距離。

第五、新原理器件缺乏突破。比如,存算一體的器件和全光交換的器件等。

2013年,導演李安憑藉《少年派的奇幻漂流》獲得奧斯卡大獎,但是超算性能發展卻按下了減速鍵。

國際上超級計算的競爭,卻還更趨激烈。

2015年,美國提出國家戰略計算計劃,美國政府多個部門協調,加快超級計算的發展。

美國能源部在NSCI(美國國家戰略計算計劃)框架下正在實施「E級計算計劃(ECP) 」,投入將近36億美元。

36億美元中的近18億美元開發軟體應用,餘下的18億美元研製3臺E級計算機。

美國,原計劃第一臺E級機Aurora將在2021上半年完成,持續性能將達到1EFlops(每秒百億億次)。後續的Frontier和El Capitan將在2021-2023年完成。從目前看,美國第一臺E級機有可能提前到2020年底前問世。

日本,對E級計算雄心勃勃,2020年6月,日本的超級計算機「富嶽」成為世界上運算速度最快的計算機。

這是時隔九年之後,日本超級計算機重登TOP500榜首。

日本的超級計算機「富嶽」

日本富嶽的運算速度超過美國Summit,峰值速度達到513.85PFlops/s,Linpack效率達到80.8%。

為了研製富嶽系統,日本富士通公司專門開發了新型ARM處理器,擴展了512位的向量部件,支持8位整數運算和多種字長的浮點運算,適應人工智慧應用需求。內存採用HBM2,訪存帶寬與計算能力之比高達0.4,這是日本超級計算機系統的特點。

系統能效有很大的改進,但功耗還是達到28.33MW,仍有改進空間。

日本超級計算機重登TOP500榜首

歐盟,計劃在2023年左右建立E級計算基礎設施,裝備3臺左右E級計算機。

在目前的歐洲先進計算合作夥伴計劃(PRACE)的基礎上發展,旨在為歐洲地區科研機構提供具有世界級水平的高性能計算服務。

歐洲,現在提出要研發自己的處理器,由Atos公司牽頭自研處理器。

另外,歐洲非常重視開源處理器架構RISC-V,在歐盟支持下,依託巴塞隆納超算建立歐洲開放計算機體系結構實驗室(LOCA)。

雖然,歐洲在超級計算機的硬體製造方面比美國和日本滯後,但是,歐洲高性能計算基礎研究和應用基礎好,在新的計算模型、語言、算法,大規模數值模擬等方面很有特色。

中國,「十三五」重點研發專項把研製依託於自主可控技術的E級計算機研發領域並行應用軟體和研發國家高性能計算環境作為其目標,要突破E級計算關鍵技術,使高性能計算在關鍵領域得到應用,並進一步推動國家高性能計算環境的服務化建設。

那麼,這一新形勢下有哪些挑戰?

2015年4月,美國對中國國防科技大學及其相關國家超算中心實施禁運。

時至今日,美國已經把中國主要的超級計算機研製單位全部列入「實體名單」,實施禁運和封鎖。

在嚴峻的國際環境下,E級和後E級計算面臨重大技術挑戰,主要包括:

降低系統功耗、提高應用性能、改善可編程性、提高系統可靠性等。

面對這些挑戰,需要體系結構的創新,關鍵技術的突破和軟體硬體的協同。

在超級計算方面,我國要解決一系列卡脖子問題。

在高性能計算硬體方面,比如:

高性能處理器和加速器、內存晶片(特別是3D內存)、新型存儲系統\器件(例如非易失存儲器件NVM)、高速互連網、光傳輸和光交換器件、IC設計EDA軟體、先進的晶片製造工藝等。

在高性能計算應用軟體方面,目前大部分工程計算軟體依賴進口,更大的問題在於,基於國產處理器的超級計算機上的系統軟體和應用軟體怎麼解決。

那麼,在超級計算E級時代,要重視哪些問題?

發展E級計算需要解決諸多技術難題。

第一要重視體系結構。上世紀八十年代是體系結構研究的黃金年代,出現了RISC、超標量處理器、多層次緩存、預期執行、編譯優化等一大批體系結構創新,使計算機性能每年提升60%。

我們希望體系結構研究再次迎來「百花齊放、百家爭鳴」的局面,使超級計算機從以規模取勝的「恐龍」式系統,向靈巧、節能、應用高效的「哺乳動物」式系統發展。

計算機體系結構有幾個基本問題。例如,馮諾依曼結構如何適應大規模的並行執行?問題的求解模型如何和計算機的體系結構相匹配?計算能力如何和訪存能力相匹配?

這些都是體系結構需要考慮的基本問題。

到目前為止,沒有一種體系結構能夠覆蓋所有應用的需求,通用與專用始終是長期爭論的問題。未來的超級計算機可能會出現多樣化、靈巧化、專用化的局面,通專結合是重要手段。

風物長宜放眼量。

高性能計算方向重點研發專項的使命和願景,是研製新一代高性能計算機及其應用系統,使算力得到大幅提升,以滿足國家創新發展的戰略需求。

兩個重點的考量分別是,研發「新一代高性能計算系統及其應用」和「帶動自主可控基礎軟硬體技術與產業的跨越式發展」。

回首20年發展,始終強調機器、應用和環境的協同發展。

未來,仍將堅持這一路線,並聚焦三大任務:

任務一、新一代高性能計算機系統的研發。

任務二、高性能計算機應用關鍵技術和領域應用軟體的研發。

任務三、依託國家超算基礎設施的領域應用平臺研發。

考慮如何使算力成為國家新型基礎設施,真正把計算能力像水電一樣便捷地提供給用戶?

建立「超算網際網路」的思路被置諸案頭。

04

東臨碣石,以觀滄海。

超算變革,前所未有。

2017年,李國傑院士就談道:

「E級計算機將是世界上最大的深度學習平臺,研究E級計算機一定要從機器學習的負載特徵中獲得需求信息,人工智慧可能是中國在超算上彎道超車的一條途徑。」

中國計算機學會高性能計算專委會秘書長,張雲泉在採訪中告訴我:

「從2019年中國HPC TOP100行業應用領域機器系統份額圖來看,大數據/機器學習佔11%,網際網路/雲計算佔34%,短視頻佔5%,三者加起來已達50%。」

「這說明了超算的新應用的崛起。」

全球Top500HPC榜單,也可以被稱為「全球速度最快500臺超級計算系統排名榜」。

2019年的榜單中近30%系統擁有加速卡/協處理器,即越來越多的系統配有大量低精度算術邏輯單元,以支撐人工智慧計算能力需求。

尤其值得一提的是,榜單前10名都擁有人工智慧計算的能力。

2019年,內蒙古呼和浩特,在HPC China會議上,清華大學計算機系鄭緯民教授也做出判斷:

「人工智慧應用有望成為超算的主流應用。」

鄭緯民院士談道:「具有頂級計算能力的超算系統理應為大規模人工智慧應用提供助力,不斷拓展人工智慧的技術邊界。2018年的戈登貝爾獎選擇大規模深度學習應用,入圍的應用中,人工智慧相關的項目也前所未有地佔據了半壁江山。」

「這一切都預示著人工智慧與超算的結合,將越來越緊密。」

彼時,計算、存儲、網絡是高性能計算的老三件。

這好比自行車、縫紉機、手錶。

而新關鍵點也進入視線,異構、數學庫、調度、通訊庫、AI庫……

矽谷鋼鐵俠馬斯克參與創立的研究機構OpenAI發布了一份「人工智慧與計算」分析報告。

自2012年以來,最大的人工智慧訓練中所使用的計算力呈指數增長,每3.4個月增長一倍。

算力是AI再次起飛的基石之一,如今已是像牙膏牙刷一樣的AI日常消耗品。

深度神經網絡規模越擴越大,超大規模人臉識別、超大規模自然語言處理模型如雨後春筍。

1750億參數的GPT-3模型更是大到石破驚天:需要大規模GPU或TPU集群,需要在可接受的時間內看到提升效果,需要異構硬體支持訓練超大規模數據或模型。

「大力出奇蹟」成為現象級需求。

微軟亞洲研究院首席研究員劉鐵巖,曾在「MSRA AI講堂2019校園行」活動中談道:

「很多研究都在追求 『大力出奇蹟』。」

另一位重量級學者周明說:

「(AI在發展)無休止的計算資源軍備競賽。」

超級計算,屹立潮頭,

人工智慧,乘風而來。

人工智慧的需求超越了任何一款晶片的單獨處理能力,必須使用分布式架構,把很多加速器晶片協同起來一塊兒工作。分布式訓練的實際性能,高度依賴底層硬體的使用效率。

一個跨軟體、跨硬體的複雜工程誕生。

困難,前所未有。

05

在中國工程院的院士中,女院士的數量,約佔5%。

1957年出生的陳左寧,歲月堂堂忽六旬,依然在為中國高性能計算事業奔忙。

2020年初,她獲得了中國計算機學會女性科技工作者「CCF夏培肅獎」。

她演講的風格樸實,聲音利落,知識密集。

簡單地說,高性能計算的目標有三個,性能,性能,還是性能。現在多了一個跟大數據和人工智慧融合的任務。超級計算機有些瓶頸是和伺服器、小型機共同的,比如內存牆。

從某種角度講,超算和人工智慧是一個戰壕裡的戰友。

但是,陳左寧院士的觀點表達出這兩個戰友配合得並不默契。

「人工智慧所需要的能力,沒提升上去。超級計算機能夠提供大量的計算能力,但是人工智慧不需要。」

一位中科院高性能計算相關的研究員也在採訪中談道:

「超級計算機為數值計算設計,並不是為人工智慧設計。所以,AI用於現在的超算體系上不合適,沒辦法物盡其用,只能說是——『能做』。」

陳左寧院士指出了方向:「經典高性能計算的環境可支持現有人工智慧模型算法,但性能功耗和性價比都比較低,並非最適合的,需要創新體系結構和軟體架構。人工智慧不需要複雜的節點計算,也不要複雜的指令系統。體系結構的需求是高可擴展架構設計,更合理的映射。」

是戰友,就應該親密無間,生死之交。

但是,科學家的口氣中都帶了些勉強。

06

日月之行,若出其中。

星漢燦爛,若出其裡。

在華為內部資料中,一份題為《超算中心建設匯報》的PPT上寫著:

「Gartner主存儲魔力四象限中,華為存儲處於領導者象限。

華為存儲的全球增長率排第一。

華為存儲在中國區市場佔有率第一(IDC全快閃記憶體Market Overview數據顯示)。」

外部資料同樣如此。2020年9月29日,IDC發布的《中國企業級外部存儲市場季度跟蹤報告,2020年第二季度》報告顯示:華為市場份額同比猛增8.9%至30%。

美國科技巨頭亞馬遜公司旗下雲計算服務平臺AWS的S3對象存儲服務是事實工業標準。

這種說法AWS官方絕對不會提。

但是可以觀察到,大多數對象存儲都有兼容S3的接口,包括,國內的公有雲(阿里、騰訊、華為),備份軟體廠商(Commvault公司等),硬體廠商(Netapp、EMC公司等)。

業內人士口頭禪是:「大家都有(與之對應的)S3接口。」

AWS和華為都是ARM的信徒,ARM也給高性能計算注入了活力。

如今,華為圍繞鯤鵬和昇騰晶片建造出屬於自己的「HPC+AI」的王國,全自研軟硬體。

首先,發揮晶片的算力要構建數學庫,華為自研全棧數學庫,遠在俄羅斯建立數學庫人才團隊。

其次,自建CANN庫和開源深度學習框架MindSpore。其中MindSpore,對標谷歌公司的TensorFlow。

再次,平臺層面有自研作業調度和集群管理,從頭開發,一行一行代碼寫,有加拿大研究院的參與。

最後,自研MPI+自研RoCE網絡,性能逼近IMPI與IB結合的網絡。

仰天一笑淚光寒,「自研」成為華為的畫風。

華為組織架構上,雲&計算BG,下面分為「雲BU」「計算產品線」「數據存儲與機器視覺產品線」,計算產品線裡包含了昇騰計算、鯤鵬計算子領域。

華為內部有大小雲之分,雲與計算BG,暱稱「大雲」,雲BU,暱稱 「小雲」。

曾在IBM任職多年,現任華為智能計算HPC解決方案首席架構師的王飛在演講中也認可大數據,人工智慧和高性能計算,大趨勢是融合。

他談道:「現在建一個大規模超算,一般不會專門針對傳統單一HPC業務,肯定會考慮在上面運行多樣性的業務,比如人工智慧,大數據等。在一個大規模的集群環境下,多樣性的業務,多樣性的負載,融合是未來發展趨勢。」

但是,更為關鍵的是,王飛用兩句話表達了長期以來的思考:

「多樣性的業務和多樣性的負載,使得我們需要多樣性的算力,在一個集群裡頭可能會使用CPU、GPU、NPU、FPGA等各種通用和專用加速晶片。而支撐這些業務的軟體平臺也需要多種,包括傳統的HPC調度平臺,AI深度學習平臺,大數據平臺、容器平臺等,業務的融合也將促使多種平臺軟體的融合,這正逐漸成為當前技術發展的趨勢。」

他冷峻的臉上,沒有太豐富的表情。

停頓了一下,他繼續說。

「以上這些,如何在一個集群裡能部署好,融合到一起,並且很好的工作,這是個困難的事情。」

07

大數據一輪,出現了變革性的系統、軟體和算法。人工智慧對變革性技術的需求也絕少不了。

人工智慧是典型的稠密計算,傳統的科學計算和事務處理系統和軟體,該如何適應?

市場,從不為困難停留腳步。

拔劍須臾,兵家必爭。

自2017年起,人工智慧伺服器快速增長。

自2018年起,五花八門廠商全棧人工智慧系統現身於大大的廣告屏上。

在2019年、2020年高性能計算大會現場,隨手抽一張廠商廣告,HPC+AI字樣已經隨處可見。

演講中,會議上,AI+HPC討論不斷,麥克風轟隆隆,掌聲譁啦啦,計時器叮叮咚。

2020年9月底,華為EI(企業智能)部門正在進行專門的AI與HPC融合的立項準備工作。按此推論,整合AI和HPC兩側的資源,共同發力,會為應對趨勢有諸多好處。

華為在上海負責該項目的員工在採訪中表示:「暫時不方便透露。」

參與者摩肩接肘,咳唾相聞。

曾幾何時,CPU的發展以提高主頻為主要方向,因不能解決巨大的功耗問題而走到盡頭。

後來,科研與產業換了車道,重點突破多核CPU技術,這個轉折讓我們趕上了。並行處理技術成為所有人的難點,我們面臨的問題,國外也沒有很好地解決。

如今,白髮蒼蒼的老年人刷抖音都像上了發條,大街小巷的智慧型手機的處理器都變為多核的了,不做並行計算不行。

並行計算技術已經處在一個全新的時代。對於AI訓練而言,多卡和多節點的支持變成硬性需求。

「下一個十年,將出現一個全新的體系結構的『寒武紀大爆發』,學術界和工業界的計算機架構師將迎來一個激動人心的時代。體系結構的改進必須和並行算法、並行軟體同步進行,而且越是高層的改進,效率提升就越大。」

李國傑院士2020年談道。

他強調:「因此,未來幾十年一定是並行計算的黃金時代。」

科技,要給歷史一個交代。

網際網路大廠盤踞網絡流量入口,歷經大數據的洗禮,搶佔AI射門的最佳位置。

這類大廠在AI訓練時,分布式計算和並行計算所用的架構有何不同?

對於這個問題,我採訪了一流科技創始人,清華大學博士袁進輝。

袁博士先解釋了之前的情況,他說:「之前,在網際網路大廠,尤其是大數據、網際網路業務中,機器學習所使用的技術架構,不是HPC的架構。」

他轉折了一下:「但是,當深度學習起來之後,他們使用的架構就趨同了。

袁進輝博士總結道:「網際網路大廠針對大數據與人工智慧的深度學習集群架構,從高性能計算的架構裡面借鑑了很多東西。比如,雙劍合璧的CPU+GPU異構計算是先出現在HPC領域的,因為深度學習本身的計算特點,高度並行,計算密集,用異構非常適合。」

他的觀點是:「現在看來,並行計算和分布式,網際網路大廠深度學習集群架構和超級計算機已經非常類似了。」

一流科技公司是深度學習框架開源軟體廠商,對標谷歌TensorFlow。一流科技與之江實驗室聯合研發了深度學習平臺。

談到錢,超算和AI就找到了共同話題。

超算一開口,就是「億元起步」。

人工智慧,土豪隨意,絲毫不甘示弱。

全球排名第一的日本「富嶽」超級計算機造價約70多億元人民幣,用電量更了不得,一年滿負荷耗電量是2.4億度。

2019年,微軟亞洲研究院一出手就買60塊英偉達DGX-2超算,花費近兩億人民幣(據一位匿名研究員透露)。

再看看幾大研究機構,鵬城實驗室、之江實驗室、北京智源研究院,均由地方政府主導、出資,算力預算都是大手筆。

我在公開信息中查到,2020年《鵬城雲腦Ⅱ擴展型項目信息化工程第一階段項目》預算28.1億元,採購產品主體為華為AI集群。

08

攝影:黃 淵

一切有如昨日。

欲行百裡者心至千裡,欲挑百斤者心受千斤。

誓師會上的淚光,胡偉武的「提頭來見」,錢德沛教授在「衡水講話」中的最後發問:

如何在外部限制與封鎖下,保持我國超級計算機的持續發展?

「這是必須回答的問題,自主可控不是應該鼓勵的可選項,而是唯一出路。『為國分憂』,不僅寫在會議PPT上,也是寫在中國高性能計算從業者心底裡的話。」

國家對科技的投入前所未有,國家對創新的期盼前所未有。

我們的目標是:產業上不受制於人,居於全球價值鏈中高端。

【鈦媒體作者介紹:《親愛的數據》出品,作者為譚婧。】

相關焦點

  • 大國重器:超級計算機,盤點我國超算發展史,產業自主化迫在眉睫
    超級計算機,給人第一感覺,都是國家層次用的,跟老百姓的日常生活「毫不相干」,其實,它真的可以稱得上是,算天,算地,算人,無所不能。例如:我們每天必不可少的,天氣預報。超算平臺開發的精細數值天氣預報系統,能準確預測未來15天以上氣象變化情況。
  • 超級計算機發展簡史——中國超算風雲錄
    在6個國家級的超級計算中心裡,一臺臺"中國血統"的超級計算機日夜不停地工作,以每秒數千萬億乃至數億億次的速度處理著全國各地發來的運算指令。 從"天宮一號"回家路線的計算,到霧霾高精度預警預報,從C919大飛機研製,到石油鑽井位置確定,從基因測序到新藥篩選,從破解密碼到宇宙演化模擬 超算的應用無所不在。
  • MIC2020|國家超級計算廣州中心主任盧宇彤:超算與人工智慧融合創新...
    本次大會邀請到中山大學數據科學與計算機學院教授、博導、天河二號副總設計師、國家超級計算廣州中心主任盧宇彤女士帶來主題為「超算與人工智慧融合創新發展」精彩分享,以下為演講實錄:實錄正文尊敬的黃局長、各位來賓大家好!很高興今天來到梅州的網際網路大會,跟大家探討超算賦能融合創新。
  • 摘取「超算下一頂皇冠」,預計下一代超級計算機2022年將落戶深圳
    如果把人工智慧比喻成一鍋香噴噴的米飯,算力是火、數據是米、算法是煮飯的巧婦,超級計算機代表的就是頂級的算力,是現代科技創新必不可少的重要基礎設施。而「下一代超級計算機」,更是被全世界公認為「超級計算機界的下一頂皇冠」。深圳超算中心大樓在遠離深圳鬧市的西麗大學城一隅,深圳建市以來單個投資額最大的國家級科技基礎項目國家超級計算深圳中心坐落於此。
  • 算天、算地、算人!超級計算機「天河一號」就是這麼神:60億人算...
    領獎片段全球超級計算機500強榜單,由美國和德國超算專家聯合編制,每半年發布一期,是給全球已安裝的超級計算機排座次的知名排行榜。在2002年以前,幾乎看不到中國計算機的身影。「天河一號」的橫空出世,在國際上引起很大震動。國家超級計算天津中心主任劉光明:曾經有國外的記者帶著一種質疑的口吻問,你們怎麼得了第一了?
  • 華高萊斯丨超級計算機產業應用發展前瞻(下篇)
    世界主要大國E級超級計算機研製計劃資料來源:中國科學院院刊(bulletin.cas.cn)國際上各個國家和地區都對超算產業進行了大力的扶持,其已經成為判斷一個國家綜合國力的重要指標,中國也已經在國際超算產業中從零開始發展到舉足輕重的地步。
  • 超級計算機強榜單公布 中國超算數量位列第一
    人民網北京6月23日電 (申佳平)由國際組織「TOP500」編制的新一期全球超級計算機500強榜單今日揭曉,中國入圍的超級計算機數量為226臺,位列世界第一。這是2017年11月以來,中國超算上榜數量連續第六次位居第一。
  • 清華大學:「神威·太湖之光」超級計算機蟬聯世界超算冠軍
    ­  北京時間6月19日17時許,在德國法蘭克福舉行的國際超級計算機大會(ISC 2017)發布超級計算機TOP500最新榜單,基於國產眾核處理器的「神威·太湖之光」 超級計算機以每秒12.5億億次的峰值計算能力以及每秒 9.3億億次的持續計算能力,繼2016年之後再次斬獲世界超級計算機排名榜單TOP500第一名。
  • 最新超級計算機排名榜:神威跌出前三,我國超算已經落後了?
    最新的世界超級計算機TOP500排名又出來了,排名第一的仍然是日本超級計算機「富嶽」(Fugaku)。曾經多次蟬聯世界超算冠軍的我國「神威·太湖之光」在最新的排名中只排名第四,不但沒有奪回冠軍頭銜,還掉出了前三,這到底是怎麼一回事?
  • 最新超級計算機排名榜發布,神威跌出前三,我國超算已經落後了?
    (23516 TFlop/s);NO.10 沙特Dammam-7超級計算機,峰值每秒運算2.24億億次(22400 TFlop/s);世界各國超算情況我國在超級計算機領域發展非常迅速,十年之前,超算幾乎都是美日歐的天下。
  • 大灣區研討會|廣州超算中心盧宇彤:超算實力讓全球科學家認識廣州
    國家超級計算廣州中心擁有世界上唯一一個六連冠的明星系統——天河二號、榮登國際最具影響力超算中心排行榜前五名,成為國內唯一上榜超算中心。中山大學國際交流與合作處處長、國家超級計算廣州中心主任盧宇彤說,「國家超級計算廣州中心的超算應用,使世界上更多的人尤其是科技領域的高端人群對中國廣州這座城市加深了印象。」
  • 超級計算機到底能幹啥
    因為需要處理大量的生物基因組數據,他們從2012年起就開始使用超級計算機。他告訴中國青年報·中青在線記者,他曾遇到各種奇怪的報錯和任務丟失,環境配置也不定時出問題,經常算出他自己都不敢相信的結果。這是因為生物信息領域在超級計算機上的應用還在起步階段,成熟的軟體不多,很多時候需要用戶和超算中心的工作人員合作開發解決問題。
  • 日本最新超算「雷神」正式揭曉,美中日交替領銜全球超算Top榜單
    不過日本新發布的雷神並非該國運算速度最快的計算機,實際上距離目前世界最快的超算、日本的 Fugaku (富嶽) 超級計算機尚有很大距離,Fugaku超級計算機最快可以每秒達到41.55億億次的運算速度,預計在明年開始啟用。在6月份最新的TOP500超算排名中,使用48核ARM晶片的日本Fugaku超算位列世界第一。
  • 臺灣清華大學首獲ASC19世界超算總冠軍,清華大學奪得亞軍
    Jack Dongarra 教授ASC競賽發起人、中國工程院院士王恩東認為,AI的興起為HPC探索出一個全新且重要的應用領域,如何實現超級計算技術與人工智慧技術更好的融合,將成為未來計算技術的一個重要研究方向。ASC通過傳統科學計算與新興人工智慧計算的賽題設計,激發大學生思考,鼓勵他們創新,探索未來人工智慧時代超算人才培養的新模式。
  • 人工智慧系統CS-1勝過超級計算機
    打開APP 人工智慧系統CS-1勝過超級計算機 IEEE電氣電子工程師 發表於 2020-12-24 10:46:34 Cerebras Systems基於有史以來最大晶片製造的專用人工智慧(AI)計算機CS-1,在一場具有5億個變量的模擬計算中,擊敗了世界排名第69的超級計算機。
  • 「青城之光」:開啟內蒙古「超算」新時代
    「超算」是超級計算機的簡稱,它是重要的科學研究基礎和手段,也是一種非常強大的工具,可謂「國之重器」。提起高大上的「超算」,很多人都覺得遙不可及,事實上,生活中的很多事情都跟「超算」密切相關。近日,剛建成運營不到1年的內蒙古高性能計算公共服務平臺「青城之光」,斬獲2020中國高性能計算機性能Top100第4名,國際人工智慧性能AIPerf500排行榜第6名,躋身中國運算能力最強的超級計算機行列。
  • 15秒完成一次CT圖像診斷 「天河二號」超級計算機搭建CT影像智能...
    在國家超級計算廣州中心,「天河二號」超級計算機,以每秒最高十億億次的超強算力,助力篩選出能抑制病毒的小分子藥物,搭建「15秒斷診」的新冠肺炎CT影像智能診斷平臺,建立新冠肺炎病患時空軌跡資料庫……以大國重器之力,與時間賽跑,與死神戰鬥。重器之下還有人。大年初九,廣州智睿醫藥科技有限公司執行長謝偉東博士搭上一班空蕩蕩的飛機,從加拿大返回廣州。
  • 全球超算TOP500最新排名:搭載ARM日本超算Fugaku首次奪冠!中國超算總數實力霸榜
    日本超算Fugaku首次搭載ARM晶片奪冠。中國超算總數持續佔據500強主導地位,共有226臺超算上榜。最近,TOP500超級計算機排名最新出爐。日本超算Fugaku首次搭載ARM晶片奪冠!目前,世界十大超級計算機中有八臺使用 NVIDIA GPU、 InfiniBand 網絡或兩者都有使用。這些超級計算機是美國、歐洲和中國最強大的計算系統。
  • Cerebras用史上最大晶片造AI計算機,比美國超算Joule快200倍
    在本周的超級計算大會SC20上,Cerebras展示了其基於Cerebras WSE的AI計算機CS-1,CS-1也不負眾望,在具有5億個變量的模擬計算中,擊敗今年世界排名第81的超級計算機Joule。一、依託巨型晶片,計算速度超Joule 200倍以上在SC20上,CS-1展示了自己針對火焰模擬的超強計算能力。
  • 它花1分鐘,超算需億年|九章|量子計算機|超級...
    「量子計算優越性」,指的是作為新生事物的量子計算機,一旦在某個問題上的計算能力超過了最強的傳統計算機,就證明了量子計算機的優越性,跨過了未來在多方面超越傳統計算機的門檻。「這將實驗各方面的技術推進到遠超以前的水平。」