2009年,一條驚人的消息被披露:「天河一號」將於2009年年底至2010年在天津濱海新區安裝部署,成為國家超級計算天津中心的業務主機。天津中心將以千萬億次計算能力躋身世界少數幾個這樣級別的超算中心行列。
超級計算機是世界公認的高新技術制高點和21世紀最重要的科學領域之一。計算能力是當今世界最重要的生產力,是衡量國家科技發展水平和國家綜合國力的重要標誌。國防科技大學是「天河一號」的研製者。1983年面世的中國第一臺億次計算機「銀河—I」,就誕生在這所大學。
中國傳統文化裡,「天河」是銀河的別稱,「天」,又是天津的簡稱。這臺計算機的名字是一個隱喻。標誌著天津與銀河計算機研發團隊的合作,開啟了一個輝煌的時代。
11年後的今天,天津超算中心正在研製新一代百億億次(E級)超級計算機。據了解,其計算能力不僅將是目前「天河一號」的百倍,還將採用自主的處理器、天河高速互連通信和麒麟作業系統,實現整個體系全自主可控。
2月初,天津中醫藥大學校長張伯禮請戰到武漢籌建中醫藥綜合治療方艙醫院,最終實現輕症病人零轉重、痊癒病人零復陽、醫護人員零感染「三個零」的亮眼成績。中西醫結合,成為新冠肺炎治療「中國方案」的亮點,而這個亮眼的戰績中,超算佔有重要的一席。
張伯禮說,天津超算中心和天津兩所大學的團隊火速研發了TCM-COVID症候調查手機軟體,在全國率先完成了新冠肺炎大樣本中醫症候學調查研究,用了三天就確定了新冠肺炎的症候特徵——溼毒疫,從而進一步確定了理法方藥,為抗擊新冠肺炎疫情貢獻重要科技力量。
這一切,並非從天而降。中國超算的前世今生到底怎樣?在中華民族偉大復興、世界百年未遇「兩個大局」背景下,天津又站在了怎樣的歷史風口?天津海河傳媒中心用兩年時間拍攝的紀錄片《逐夢天河》,掀開了這個答案的一角。
鄧小平:「中國要搞四個現代化,沒有巨型機不行!」
這句話是中國改革開放的總設計師鄧小平1978年說的。巨型機就是高性能計算機,又稱超級計算機,是目前地球上計算能力最強的電腦。
2010年,「天河一號」以持續速度每秒2570萬億次浮點運算、峰值速度每秒4700萬億次雄冠全球。
這個速度有多強呢?可以這麼想像一下:它運行1小時,相當於13億人同時計算340年。
計算,改變了人類發展進程。兩千多年前,中國人發明了算盤,總結出珠算口訣,結束了人類用手指、繩結計算數字的時代,堪稱人類計算史的裡程碑。隨著社會不斷進步,人類對於計算能力的需求水漲船高……
時間進入近代。
中國,卻因為種種原因沒有跟上計算的發展步伐。
1946年2月,美國「計算機之父」馮·諾依曼成功研製世界第一臺電子數字計算機——ENIAC。一條炮彈飛行的軌跡, 20秒鐘就能被算完,人類社會由此邁入了計算機時代的門檻。
新中國成立之後,國家百廢待興 ,我國的科研先驅在艱苦的科研實踐中充分地認識到科學計算在新中國國防、科技事業中的地位和作用,也開啟了計算機事業的追求與探索。
1958年,因為要研製魚雷快艇指揮儀,哈軍工海軍工程系任副主任、雷達教研室主任慈雲桂帶領9名學員邁出了中國自主設計研製電子計算機的第一步。
1964年11月,代表我國第一代電子管技術的通用數字計算機441B,在慈雲桂他們的手中宣告誕生,中國整整落後了美國12年,而在第二代電晶體計算機441-B問世後,這一技術的差距被縮短到了6年。
此後10年,隨著集成電路技術的應用,世界算力再次迎來了新的突破。幾乎就在中國百萬次計算機誕生的同時,美國科學家運用向量技術,實現了數據批量化處理,算力直指億次大關,這也標誌著計算機前沿領域跨入高速度、大容量的巨型機時代。
面對國家經濟建設的迫切需求,面對西方國家的技術封鎖和卡要,中國高層領導決策者和科學家們又一次體現了遠見卓識和戰略定力。
1978年,對於中國算力來說,是一個載入史冊的節點。那年,改革開放總設計師鄧小平指出:「中國要搞四個現代化,沒有巨型機不行!」陽春三月,中央召集巨型機研製部署會,研製任務,又一次落在了慈雲桂的肩上。此時,這支歷經哈軍工分建南遷,輾轉湖南長沙的科研團隊,研製出的最快計算機151也只有每秒100萬次,與世界億次計算機相差甚遠。
這一年,慈雲桂雖已年逾花甲,卻熱血難耐,當即就立下了軍令狀,「每秒一億次,一次不少!六年研製時間,一天不拖!預算經費,一分不超!」。
六年,是時間的長度,更是財力的厚度。西蒙·克雷之所以能研製出世界第一臺每秒億次機克雷-1,除了他的智慧,還有美國擁有世界最深厚的技術積累,最雄厚的經濟支撐,最完備的工業基礎…...
那時,中國工業基礎薄弱,電子元器件性能和工藝水平落後,慈雲桂的研究所人手不夠一百, 連間像樣的實驗室都沒有,設備嚴重老化,加之國外對技術的封鎖,這個時候,啟動每秒億次巨型機工程,困難重重。
事實上,當慈雲桂懷揣任務,回到學校時, 困難確實遠比想像得多,搭團隊,建廠房,攢設備,一次碰頭會上,慈雲桂邊討論邊扳著手指頭數,每根手指彎了4遍,整整40個問題,如同40座山。
建工廠需要集結大批隊伍。但此時,巨型機研發團隊剛剛南遷長沙,基本生活條件都難以保障,而最難過的一座大山還是巨型機的核心技術。
慈雲桂團隊成員、中國計算機事業先驅胡守仁說: 「『克雷1』,主頻是80兆赫茲,我們只能20兆赫茲,那速度比它低。怎麼能夠設計出一億次機來?向量部件是一個運算的部件,『克雷1』只有一個,我把它搞兩個,兩個同時算,那不是速度提高一倍了?」
這一精妙構思,在利用落後元器件,保證巨型機算力的同時,也使設計變得更加複雜。為了配套向量部件,主存材料和存儲方案必須創新;為了避開液冷技術的短板,不得不沿用風冷技術,改良通風管路。設計師前後繪製了5000多張密如蛛網的邏輯圖,然而實現這一切的前提,國產元器件的質量必須過硬,哪怕有一環出現閃失,整個技術路線都要推倒重來。
這是一次以勤補拙的艱難探索,5年時間,慈雲桂和全體研發人員、放棄了節假日,吃在工廠、睡在機房。當時加班費一晚上兩毛錢,卻沒有一人來領。大家心有靈犀,為的就是省下每一分錢,用在零件、設備的生產上,儘快造出中國的巨型機。
一批科研人員,用身體做燃料,完成了對巨型機各環節的攻關,最終,全機4萬多條繞接線,12萬個繞接點,全機861塊插件板,兩百多萬個手工焊點,無一錯繞、無一虛焊。
1983年12月22日,新華社、人民日報等近二十家中央媒體同時向世界宣布:中國第一臺每秒運算一億次以上的「銀河」巨型機研製成功。它填補了我國巨型計算機的空白,標誌著中國躋身世界少數幾個能研製巨型機的國家行列。
1984年,改革開放後的第一次閱兵式上,天安門廣場彩旗飄揚,「銀河」巨型計算機模型受閱通過天安門廣場,閃耀神州。這無疑給正處於改革開放之初,充滿希望的中國注入了一支強心劑。
銀河巨型機一經問世,石油勘探、火箭發射模擬、空氣動力學設計等各領域需求紛至沓來,大大縮小了與國外的科技差距。
因為西方設限,超級計算追趕世界的腳步不得不快
時代在飛速變化。
20世紀80年代初,中國氣象局為實現中長期預報應對颱風等氣象災害,希望從美國進口一臺每秒10億次巨型機,但對方提出了比出口歐洲高出近10倍的價格,並且設置了諸多技術保密的環節。進口巨型機談判曠日持久,多年未果。
李澤椿院士說:「那時候美國、歐洲發達國家,包括日本在內,有一個巴黎統籌委員會,他們專門限制高新技術輸送給(前)蘇聯、中國等國家,所以你必須通過他批准,你才能進口到大的計算機,否則不賣給你。非常嚴格。」
實踐告訴中國科學家:關鍵核心技術是要不來、買不來、討不來的。
作為慈雲桂的接班人,銀河—Ⅱ總設計師周興銘回憶:「1986年,銀河-1出來已經三年了,但從國際上來看,其實是十年以前的技術了。你不進則退呀,再不發展就落後了,所以我們心裡有點著急。當時我們三個教授,陳福接、我,還有陳立傑,我們三個人就給中央寫了一封信:我們已經有能力研製10億次的機器了。我印象裡很快就批覆下來。」
1986年,為了滿足中國氣象局中長期天氣預報需求,銀河—Ⅱ巨型機研製項目正式上馬,運算速度每秒10億次,算力將比銀河-1巨型機提高10倍,大家滿懷信心、全力以赴投入研發。
可就在銀河—Ⅱ橫空出世的前一年,1990年7月21日11時05分,慈雲桂那顆頑強不息的心臟永遠停止了跳動。即便是在生命的最後時刻,他依然為「銀河—Ⅱ」的研發以及學生的培養殫精竭慮。他生前說:「假如人生能實現一個夢,我的這個夢,就是讓中國在世界高性能計算領域擁有一席之地。」
薪火相傳,從未停止。就在慈雲桂去世後的第二年,每秒10億次並行計算機銀河—Ⅱ橫空出世,「胸懷祖國、團結協作、志在高峰、奮勇拼搏」的銀河人完成了「銀河—Ⅱ」巨型機從向量計算到並行計算的飛躍。這項技術路線的突破,不僅讓銀河人用四年時間走完了別人十年的路,也使得中國氣象預報的預測實踐和精度跨入了世界水平。
逐夢天河:「天河一號」國際T0P500排名第一
超算時代,是速度競爭的時代。
從1993年起,美國工程院院士傑克唐加拉和德國專家漢斯·沃納梅爾聯合編制了一個「TOP500(全球超級計算機500強)」榜單,從系統性能、技術方向等多個方面反映了全球超級計算機的最新發展狀況,早已成為世界最權威的超級計算機「座次表」。
2010年,路易斯安娜州紐奧良市舉辦的世界超級計算大會上, 「天河一號」二期系統,以峰值計算速度每秒4700萬億次,高出第二名美國克雷「美洲虎」1倍多的絕對優勢,勇奪國際T0P500排名第一。
「異構融合」——依靠這一體系結構的偉大創新,中國超算實現了彎道超車,成為了繼美國之後世界上第二個能夠研製每秒千萬億次超級計算機的國家。
「天河一號」工程啟動後,時任天河一號總設計師的楊學軍決定帶領帶科研團隊在沒有先例可循的路上艱難探索,走別人沒有走過的路,在世界上率先採用CPU+GPU異構融合體系結構,利用GPU加速科學與工程計算應用程式。
但如何發揮GPU計算性能,是舉世公認的科學難題。「天河一號」總師組將破解這個難題的艱巨任務交給了楊燦群帶領的課題組。他們搭建CPU+GPU異構系統後,測算發現有強大圖形處理能力的GPU針對科學與工程計算問題的計算效率只有20%左右,遠遠達不到「天河一號」所需的計算效率。
為了提高GPU的性能,楊燦群毅然帶領課題組遠離市區進行封閉式攻關,開展GPU計算效能優化研究。他們不會客、不外出,每天只做一件事:一步步優化應用程式,一遍遍測試性能優化效果,常常緊緊盯著電腦顯示屏,從那些不停滾動的數據中,尋找一個個稍縱即逝的靈感,捕捉一次次優化GPU計算效率的機遇。
有一次,楊燦群從早上7點一直工作到午夜,因長時間觀察電腦屏幕上的測試數據,躺到床上閉上雙眼,屏幕上的數據隱約還在眼前滾動,他突然覺察到其中的幾行數據可能低於期望值。他一骨碌從床上爬起來,打開與伺服器相聯的筆記本電腦,進入試驗資料庫,果然發現GPU一部分計算資源沒有用起來。興奮難抑的楊燦群,立刻著手改進程序,使GPU的計算性能又一次得到提升。類似這樣的優化改進,他們在兩個月裡進行了一萬多次,終於把GPU的計算效率提升到接近60%,充分展示了「天河一號」CPU+GPU技術的光明前景。
楊燦群帶領團隊連續奮戰四個月,先後改進優化8萬餘次,創造了一個科學奇蹟:GPU計算效率躍升至70%以上,為「天河一號」橫空出世並衝刺世界領先水平掃清了障礙。
從中專生到博士,從助教到研究員、「天河」超級計算機副總設計師……在追逐夢想的徵途中,楊燦群一次次華麗轉身:先後主持國家863計劃、國家自然科學基金等課題10多項,獲得國家科技進步特等獎1項、一等獎1項,部委級科技進步一等獎5項。
國家超算天津中心主任楊燦群
現任國家超算天津中心主任楊燦群告訴記者,「天河」橫空出世,成為我國首臺世界排名第一的的超級計算機,讓超級算力服務於濱海新區、京津冀,乃至全國,不斷帶動國家科技創新和產業發展,其示範引領效應使我國的超算系統研製和應用得到了飛速發展。
從「玻璃房子」到「超算強國夢」
去年,是孟祥飛加入國家超算天津中心的第十年。他從一個剛畢業的博士生作為技術骨幹加入超算中心,到成為應用研發部部長,多年來長期負責我國重大自主創新成果「天河」系列超級計算機的應用技術研發與開拓。
孟祥飛出生在改革開放之初的1979年。當時,百業待興,中國還沒有成熟技術造自己的超級計算機。花高價買來的國外超級計算機要放在獨立的機房裡,只準國外的工程師用,而中國工程師只能在「玻璃房子」外面看看。這是一段令中國科技界蒙羞的過往。
回顧他的職業生涯孟祥飛感慨良多。
應用研發部部長孟祥飛(右二)
「我是研究理論物理的,研究宇宙的起源需要超級計算機去算,當時國內民用領域的超級計算機很少,沒有辦法,2007年,我申請公派到美國去學習,實際上就是蹭人家的超級計算平臺。當時在美國,一個普通大學裡面就有超級計算機,更不要說人家在國家實驗室那些大研究機構,正是這些超級計算能力和現代化的研究平臺,支撐了美國的先進科技創新能力,當時我就想我們國內都沒有,到人家這裡一個普通大學就有,什麼時候能趕上人家,當時心裡衝擊是特別大的。」
巨大的衝擊也讓孟祥飛心裡憋著一股勁兒,2009年學成回國後,他放棄了已經拿到手的工作邀約,加入了正在籌建當中的國家超算天津中心。
2010年,當在電話裡聽到「天河一號」取得了世界第一時,孟祥飛熱淚盈眶:「我記得特別清楚,當時因為有時差,是在深夜裡,我激動得圍著機房跑了兩圈。」
可在科技創新的道路上,總會面臨各種非議。一些國外專家質疑,中國就是造了一臺大型遊戲機,中看不中用!那時候,中國超級計算機的應用領域還有很多空白。孟祥飛說:「幹不好『天河』的應用,我捲鋪蓋走人。」他的「狠話」並沒有落空,天河超算應用團隊依託技術牽引,「天河一號」的運行效率很快達到世界一流超級計算機水平,不僅推動了國家重大科技創新領域發展,還為產業領域累計增效近百億元。
目前,「天河」系列超級計算機已經實現了在航空航天、氣候氣象等十多個領域的廣泛應用。我們日常大眾的吃穿住用行到娛樂,實際上都有超算發揮作用的影子,哪種農產品改造後更好吃,哪種材料的衣服穿起來最舒服,電影特效渲染,甚至汽車、飛機的設計等都離不開超算。
孟祥飛介紹,超級計算機可以為飛機建造一個虛擬空間的數值風洞,了解和研究飛機的穩定性、油耗等數值,像波音787這種大型飛行器,用實物的實驗風洞完不成的試飛測試,都可以用超算完成虛擬試飛。高通量虛擬篩選還可以加速新藥的研發,使一種新藥的研發周期縮短兩年,節約上億美元的成本。
天河超算應用團隊完成了一次又一次創新突破,開發出了國際首款大規模異構並行模擬軟體,使「天河」成為可控核聚變研究的領先平臺;參與我國霧霾預警預報與評估系統研發,構建起我國第一個高解析度霧霾預報準業務化平臺。
據了解,天津工業大數據研發中心初期計劃用三年時間,搭建面向京津冀的工業大數據和工業網際網路聯合融合平臺,藉助新一代天河巨型機的計算能力,建設工業大數據創新中心,最終形成「產學研用資」全鏈條的工業生態,服務製造業轉型升級。目前,天津超算中心正忙著在現有濱海工業雲平臺基礎上,依託工業大數據,構建國家級工業大數據創新中心。
如今,在傑克唐加拉教授整理的TOP500名單裡,中國超級計算機已經佔據了228臺,部署量位居世界第一。
數據即未來 信創推進產業邊際不斷拓寬
2019年,信創產業開始進入了大家的視野。所謂信創產業,即信息技術應用創新產業,是一個萬億級市場,它涉及到一條龐大的產業鏈,IT基礎設置、基礎軟體、應用軟體和信息安全等。
超級計算是信息技術創新的核心驅動,推動整個信創產業基礎產品的創新。楊燦群說,過去中國 IT 底層標準、架構、產品、生態大多數都由美國 IT 巨頭來制定,由此存在諸多的安全風險,也可能會被「卡脖子」。
「信創」已成為2020年一個新風口。在國際貿易衝突和信息安全大環境下,信息技術的國產化替代勢在必行。全球IT生態格局將由過去的「一極」向未來的「兩級」演變,中國要逐步建立自己的 IT 底層架構和標準,形成自有開放生態。信創產業是數據安全、網絡安全的基礎,也是「新基建」的重要內容,將成為拉動經濟發展的重要抓手之一。
楊燦群介紹:「在超算研製的過程中會產生很多副產品,如CPU、網絡設備、作業系統、編譯系統等,這些都是信創產業的核心基礎。與此同時,超算中心不僅僅是一個計算中心,同時也是一個數據中心,可以針對信創產業的需求提供相應的技術服務,從而帶動和反哺信創產業更快、更好地發展。」
在楊燦群看來,以目前的信創產業為契機,全面實現以作業系統、晶片、資料庫、應用軟體等為核心的國產自主安全平臺,隨著雲計算、物聯網、AI、大數據等應用,持續促進底層能力的提升,上層業務不斷拓展。
信創產業作為當今形勢下國內經濟發展的新動能,不斷拓寬著其他產業的創新邊際。以超算為基礎的信創產業,為眾多課題提供了更多應用場景和解決方案。比如,依託天津超算中心為基礎的京津冀大數據協同處理中心,推動了京津冀重大科技協同創新、區域產業發展、社會公共服務能力等領域的加速發展,目前已經初步形成了覆蓋國家、區域、地方的三級政務數據支撐平臺,在京津冀區域形成了面向高端裝備製造、礦業、氣象、能源勘探、個性化健康、大病慢病等行業大數據服務能力。
目前,京津冀大數據協同處理中心在京津區域已經服務研發機構、企業、政府部門超過1000家,自身直接經濟效益超過5500萬元,為企業新增經濟效益超過40億元,實現服務工業企業、醫療機構、政府部門研發效率和產品競爭力提升、培育新經濟增長點、聚集國際領先的研發團隊等綜合成效。
數據即未來,正是基於超級計算機大數據、雲計算的分析能力,信創為更多的產業帶來顛覆性的變化。
在第二屆世界智能大會上,由國防科技大學和國家超算天津中心共同研發的新一代百億億次超級計算機原型機,就已驚豔亮相。如今,天河、神威、曙光三大E級原型機已全部交付。
40年前,中國在超級計算領域還是一張白紙,一代代科研人員肩負著國家的期望和託付,艱難探索;40年後,我們的超算領域已經處於國際領先地位,而科研人員們,依舊在為夢想而拼搏、為強國而奮鬥。
來源:津雲
審核:王韶雲
編發:王 安
素材整理:王安、許曉偉