沒有超級計算機,也敢玩高性能計算?

2020-12-04 計算機世界20201118

隨著成本的下降和應用情形的增多,高性能計算吸引了各種類型和規模的新用戶。擴展應用包括基於超級計算機的高性能計算系統、基於集群的高性能計算和高性能計算服務雲。

在當今數據驅動的世界中,高性能計算(HPC)正成為企業尋求深入了解基因組、計算化學、金融風險建模和地震成像等領域的首選平臺。最初,高性能計算受到需要進行複雜數學計算的研究科學家們的歡迎,而現在,越來越多的企業開始關注這一領域。

高性能計算機數據存儲系統提供商Panasas公司的系統工程總監Dale Brantly介紹說:「依靠數據的收集、分析和分發而蓬勃發展的環境,以及依靠可靠的系統來支持具有巨大計算能力的工作流程等等,都需要高性能計算。」

雖然中小企業採用的仍然相對較少,但對於願意投資於技術和員工專業知識的企業來說,這項技術具有巨大的潛力。

通常,高性能計算應用情形主要集中在某種類型的仿真上。谷歌雲首席技術官辦公室高性能計算和量子計算技術總監Kevin Kissell解釋說:「例如,機翼氣流模擬、發動機燃燒、行星天氣系統、核反應以及投資組合估值等。」其他應用情形則針對分析目標,例如,衡量廣告投資回報率,或者評估業務部門的績效等。還有其他的應用情形可以歸類為轉換應用或者轉型應用。他說:「比如電影和視頻渲染。」

沒有超級計算機的高性能計算

很多企業和IT領導們都有一個誤解,那就是所有的高性能計算系統都是基於超級計算機的。事實上,雖然由Atos、IBM、HPE/Cray和Fujitsu等公司生產的超級計算機是很多專業高性能計算系統的核心,但一種使用更廣泛的方法是將多臺小型計算機集中到互連的集群中,以提供高性能計算功能。在這種布局下,集群中的每臺計算機都是一個節點。每個節點通常配置多個處理器,稱為計算核心,用於處理計算任務。每個節點內的處理器、圖形處理單元(GPU)和內存資源相互連接,以創建高性能計算系統。

由於實現並運行超級計算機及其定製軟體的成本很容易達到數百萬美元,因此,這項技術仍然遠遠超出大多數企業的財務承受能力。集群式的高性能計算機使用相對便宜的聯網計算機,運行現成的軟體,通常更易於部署和運行。儘管如此,對於大多數企業來說,特別是那些高性能計算需求有限的企業,即使是規模不大的集群型高性能計算也是很大的投資。

現在,這種情況正在改變。希望在不突破IT預算的情況下使用高性能計算的企業可以選擇轉向公有雲服務,例如,谷歌雲、微軟Azure、亞馬遜網絡服務(AWS)和IBM雲等。

數字服務和軟體工程公司Ciklum的.NET技術主管Maksym Pavlov說:「利用這些服務,企業能夠通過高性能計算功能來滿足其業務需求,而無需對高性能計算集群的硬體基礎設施進行大量投資。」IBM的百億億次計算副總裁David Turek補充道:「雲的出現在某種程度上拉近了小企業和大企業之間的差距。」

從高性能計算集群到高性能計算雲

北卡羅萊納大學教堂山分校(UNC-Chapel Hill)長期以來一直依靠其內部高性能計算集群來支持多個科學、工程和醫學領域的研究活動。然而,隨著研究計算需求的不斷增長,當前系統的計算資源和容量開始滿足不了用戶需求了。大學並沒有擴大現有的高性能計算投資,而是決定轉向雲,為用戶提供一個按需的高性能計算環境。

該方法證明既有成本效益又非常靈活。北卡羅萊納大學教堂山分校臨時首席信息官Michael Barker介紹說:「藉助於雲計算,我們可以提供完成必要工作所需的計算能力,並且只要工作需要,我們就可以隨時提供這些計算能力。這是一種滿足運行計算工作需求非常有效的方式。」

北卡羅萊納大學教堂山分校高級研究助理Jeff Roach表示,遷移到雲端既有必要,也非常受歡迎。他說:「我們有一個非常傳統的本地集群。」然而,隨著時間的推移,越來越明顯的是,該系統逐漸跟不上需要先進計算能力和更快性能用戶的需求。他說:「我們發現,我們的本地集群對其設計目標用戶的工作效果非常好,但除此之外,其一些優勢應用卻變得不那麼有優勢了。」

隨著計算需求應用情形迅速流行起來,北卡羅萊納大學教堂山分校開始與谷歌雲和仿真分析軟體提供商Techila技術公司合作,規划進入高性能計算雲的旅程。規劃後的第一步是概念驗證評估。Roach說:「我們找了一名在校研究人員,他的工作就是進行大量的高內存、交互式計算,我們想要測試一下他的工作量。」他說,這個結果絕對是成功的。「研究人員真的很喜歡,他完成了工作。」如果在大學的本地高性能計算集群上運行,同樣的任務可能需要一個星期才能完成。Roach說:「而他僅用幾個小時就可以完成很多工作。」

在大西洋的另一邊,約克大學也決定採用基於雲的高性能計算方法。英國皇家學會行業研究員、約克大學生物系教授James Chong介紹說,生物、物理、化學和計算機科學等理科系以及語言學和其他一些學科的師生廣泛採用了高性能計算。

Chong的團隊目前正在使用谷歌雲來分析DNA序列數據。他解釋說:「具體來說,我的團隊對微生物群落很感興趣,這是一種混合微生物群落,參與了把廢物(在我們的研究中,是汙水汙泥)轉化為沼氣的過程。我們使用高性能計算把DNA短序列重組成一個宏基因組,然後分離出不同微生物的基因組,這樣我們就可以理解這些微生物是怎樣對其生長條件的變化做出反應的。」

與北卡羅萊納大學教堂山分校的同行一樣,Chong也非常欣賞高性能計算雲服務所能提供的強大功能和靈活性。他說:「我們的高性能計算能力能夠滿足一系列需求,有些用戶需要大量的處理器,而有些則需要大容量內存機器。作為生物學家,我們使用的一些應用程式很快就會綁定到I/O,因此我們也非常需要超高速硬碟訪問功能。」

大學使用的高性能計算雲也能夠適應不斷變化的需求。Chong指出:「我們中的很多人開始使用機器學習技術,希望能夠利用不同的體系結構。」他補充道:「這所大學的用戶範圍很廣,這意味著我們還需要使用一系列不同的軟體包。」與大多數高性能計算雲一樣,約克大學使用的服務支持各種類型的研究人員輕鬆快速地在軟體工具之間切換,而不會在獲取、部署或者配置問題上浪費時間。

使用超級計算機的高性能計算

雖然高性能計算雲服務有某些優勢,但對於關心安全和隱私的企業來說,它並不總是最佳或者最合理的選擇。Turek注意到:「這些企業對於數據存放的位置非常敏感。例如,尤其是當考慮到歐洲的GDPR限制時。」(GDPR是歐盟隱私法《通用數據保護條例》的縮寫。)

為了同時滿足隱私和對巨大計算能力的需求,邁阿密大學最近選擇投資一個基於超級計算機的內部部署的高性能計算新系統。最關鍵的是,該大學認為,擁有大量多維數據集的研究項目在專門設計的高性能超級計算機上能夠運行得更快。

去年8月,該校推出了基於Power Systems AC922伺服器的IBM Triton新型超級計算機。邁阿密大學計算科學中心主任、數據和研究計算副教務長Nicholas Tsinoremas介紹說,已有2千多名師生使用該系統開展氣候預測、基因組學、生物信息學、計算機視覺和人工智慧等項目。

雖然部署成功了,但還是遇到了一些基本的障礙,這是任何採用高性能計算的用戶都能預料到的——無論其規模、領域或者計算需求如何。Tsinoremas說:「遷移總是一個問題。」還必須解決用戶培訓和再培訓問題。他指出:「新系統與傳統存儲系統的集成則是另一個難題。」

所有這些問題都強調了這樣一個事實:無論高性能計算系統是基於本地的還是在雲端的,要想順暢地採用都要做好計劃和準備工作。Tsinoremas提醒說:「內部的專業知識是必要的,各部門也必須有計劃。」理解工作負載的性質和要求也很重要。他說:「換言之,採用者應了解他們要解決的問題,自己知道希望高性能計算怎樣幫助解決這些問題。」

高性能計算工作負載入門

另一個關鍵點是,要清楚地知道選擇正確的資源管理工具非常重要,只有這樣,企業才能使用好並優化高性能計算環境。仿真軟體以及其他高性能計算工具和服務提供商Altair的高級產品管理主管Jérémie Bourdoncle說:「無論是購買傳統的高性能計算硬體環境,還是在雲端利用高性能計算,或者兩者的結合,根據企業的工作類型和吞吐量需求選擇合適的高性能計算工作負載管理器都是非常重要的。」工作負載管理器能夠自動進行作業調度,實現管理、監視和報告功能。

Kissell建議應用策略應注重知識性、簡單性、選擇性和謹慎性。他建議:「這可能是一個漫長的旅程,所以計劃好你的旅行,但也要給自己調整旅程的機會。」選擇一個簡單但有代表性的測試應用情形,從中可以清楚地看到從高性能計算模擬或者分析中獲得的知識和深度分析結果。「然後針對你的問題類別選擇一個簡短的軟體包列表,並進行嘗試。」

作者:John Edwards是一位資深的商業技術記者。他的文章發表在《紐約時報》、《華盛頓郵報》以及很多商業和技術出版物上,包括CIO、ComputerWorld、《網絡世界》、CFO雜誌、IBM數據管理雜誌、RFID雜誌和《電子設計》等。

編譯:陳琳華

原文網址:https://www.networkworld.com/article/3444399/high-performance-computing-do-you-need-it.html

排版編輯:周星如

排版審核:劉 沙

越來越優秀的你還可以看看

相關焦點

  • 「高性能計算」重點專項-「E級計算機關鍵技術驗證系統」等3個項目...
    近日,在天津濱海新區,國防科技大學與國家超級計算天津中心舉行 「高性能計算」重點專項項目 「E級計算機關鍵技術驗證系統」、「面向E級高性能計算機的新型高性能互連網絡技術研究」、「基於自主創新的石油地震勘探行業應用平臺」項目聯合啟動會。
  • 2019年人工智慧對高性能計算的10種影響
    Cray公司早期推出的超級計算機就是一種向量超級計算機,它將應用程式表達為向量和矩陣代數問題,這反過來又加強了計算機的設計,以確保向量計算的快速運行。多年來,這種強化循環強烈定義了高性能計算(HPC)。張量代數可以被接受為廣義矩陣代數,因此它是超級計算機數學能力的自然演化,而不是一場革命。任何支持矩陣運算的機器都可以進行張量運算。
  • 高性能計算之源起——科學計算的應用現狀及發展思考
    超大規模科學計算的顯著特徵是可計算問題的規模巨大,TOP500①排名前十的超級計算機系統一般擁有千萬個以上數量的處理器核心,按照單處理器核心可處理100萬個未知量來計,這意味著可計算處理具有1萬億個自由度的複雜系統。即便如此,當今世界上計算能力最強的這些高性能計算機在那些複雜度更高的科學計算應用對計算能力幾乎無止境的需求面前,也顯得杯水車薪。
  • 領銜創新,曙光新一代矽立方高性能計算機亮相SC18
    德克薩斯州達拉斯市2018年11月13日電 /美通社/ -- 11月11日~16日,全球超算領域的年度盛會 -- 全球超級計算大會(SC18)在美國德克薩斯州達拉斯市拉開帷幕。本屆大會以「HPC Inspires」為主題,點燃起業界人士對於高性能計算機(HPC)巨大潛力的期待。
  • 中國成功研製千萬億次超級計算機「天河一號」
    我國成為繼美國之後世界上第二個能夠研製千萬億次超級計算機的國家。超級計算機又稱高性能計算機、巨型計算機,是世界公認的高新技術制高點和21世紀最重要的科學領域之一。這是「天河一號」千萬億次超級計算機系統。
  • 科技創新70年丨中國超級計算進擊史
    (表格來自 AMiner)中國國家層面的超級計算機自研事業始於 1978。那年 3 月在全國科學技術大會上,鄧小平一句「中國要搞四個現代化,不能沒有巨型機」,開啟了自研超級計算機的歷史進程。(曙光 3000 超級伺服器)曙光系列頻頻升級的同時,863 計劃在計算機系統研發方面的內涵也發生了變化。1999 年至 2000 年間,863 計劃 306 主題進行重大課題「 國家高性能計算環境」 。這意味著,不僅要研製超級計算機,還要用所研製的機器建立高性能計算環境,更好地支持高性能計算的應用。
  • 四方面提升 微軟HPC Server 2008推動高性能計算
    Mendillo表示,摩爾定律已經是眾所周知了,即CPU的處理能力每18個月翻一番,儘管在當前這一定律仍沒有完全被打破,但是現在各家廠商更多是通過並行計算和多核的方式來增加計算能力。多年來,軟體的發展包括算法等主流的方向都是基於線性編程的方式,並不能很好地適應現在的需求,原來的硬體問題變成了軟體的問題。
  • 中科曙光新一代矽立方高性能計算機亮相全球超算大會
    新華社美國達拉斯11月13日電(記者 周舟)正在美國達拉斯舉行的全球超級計算機大會上,浸泡在突突冒泡的恆壓液體中「衝涼」的中央處理器和圖形處理器仍能正常通電運行,吸引了大量參會者圍觀。這是中國高性能計算機企業中科曙光13日展示的新一代矽立方高性能計算機。
  • NVIDIA為什麼能夠在高性能計算領域獲得成功?
    • 摘要:本文將介紹GPU在工作站以及高性能計算方面所取得的成就。除了新技術為傳統PC應用所帶來的新體驗,其在高性能計算領域的應用則讓很多與會者大開眼界。NVIDIA為什麼能夠在高性能計算領域獲得成功?筆者認為,這其中有三方面的因素影響。  • 標籤:NVIDIA 高性能計算 GPU  本文將介紹GPU在工作站以及高性能計算方面所取得的成就。
  • 2010高性能計算-理論與計算化學國際研討會在哈爾濱召開
    12月6日至8日,由中國科學院計算機網絡信息中心超級計算中心(SCCAS)「計算化學虛擬實驗室」(VLCC)與哈爾濱理工大學(HUST)聯合主辦的2010高性能計算——理論與計算化學國際研討會(ISTCC10)在哈爾濱市舉行。
  • 曾慶存院士:中科院地球系統模式,自研巨系統大規模高性能計算
    從20世紀70年代開始,「戰略計算機計劃」、「高性能計算和通訊計劃」、「加速戰略計算計劃」、「先進計算設施夥伴計劃」等一系列戰略計劃的推出,引出了高性能計算這個炙手可熱的學術研究方向。,對高性能計算機提出了極高要求。
  • 中國誕生首臺百萬億次超級計算機背後的故事
    由此,中國成為世界上第二個可以研發生產百萬億次超級計算機的國家,中國高性能計算領域的歷史也從此進入一個新的紀元。  篳路藍縷,以啟山林  對於微軟公司和作為國內高性能計算領域翹楚的曙光公司來說,這樣成績的取得似乎完全在情理之中;然而任何驚人奇蹟的創造,背後都往往蘊藏著開創者們不為人知的艱苦努力。
  • 中科院研製出我國首臺百萬億次超級計算機
    記者從落戶天津高新區的曙光公司產業基地獲悉,由中國科學院計算技術研究所、曙光信息產業有限公司自主研發製造的百萬億次超級計算機「曙光5000」近日研製成功
  • 國家超級計算鄭州中心通過驗收 這是全國第7家國家超級計算中心...
    河南商報記者郭丁然11月23日,河南商報記者從河南省科學技術廳了解到,科技部近日印發了《關於國家超級計算鄭州中心通過驗收的函》,批覆同意國家超級計算鄭州中心通過驗收並納入國家超級計算中心序列管理。中心配備技術先進、自主可控的中科曙光新一代高性能計算機,峰值計算能力100PFlops,存儲100PB,主機系統實測持續計算性能居國際同期前列。
  • GPU集群大會:一場高性能計算的頭腦風暴
    大會請到了十餘位國內外知名的專家及學者來進行演講,NVIDIA吳強《GPU加速深度學習應用》、中國科學院計算所張雲泉《國際超級計算的發展態勢分析與展望》、Mellanox馮高峰《MellanoxInfiniBand方案助力高性能計算和深度學習》、IBM技術專家錢廣銳《IBM NVLINK GPU加速和分布式機器學習平臺》、中國科學院計算機網絡信息中心趙地《深度學習與醫療影像大數據分析
  • 北大教授:超級計算機計算性能提升速度是"十年千倍"
    楊超在《淺論超級計算、人工智慧與科學計算的融合發展:以偏微分方程求解為例》的分享中闡述了人工智慧與超級計算和科學計算的融合發展趨勢。近年來,超級計算機的計算能力不斷突飛猛進,為科學計算和人工智慧領域的諸多難題的解決提供了強大的算力支撐。與此同時,科學計算和人工智慧的發展也對超級計算機的研製產生了深刻影響。
  • 深圳、上海超算中心攜手共建E級超級計算機
    央廣網深圳12月6日消息(記者鄭柱子)12月5日,國家超級計算深圳中心與上海超級計算中心在國家超級計算深圳中心舉行戰略合作協議籤約儀式,攜手共建E級超級計算機,共促粵港澳長三角先進計算能力戰略合作。E級超算是指每秒可進行百億億次數學運算的超級計算機,被全世界公認為「超級計算機界的下一頂皇冠」。根據協議,深圳、上海雙方共同推動E級超級計算機需求分析、架構優化、應用優化等相關工作,提高E級超級計算機系統適應未來科技創新需求的能力。
  • Gaussian 為您打造量子化學計算的「超級大腦」
    來源:深圳超算自1946年第一臺電子計算機ENIAC現世以來,高性能計算機已經經歷了三次大的發展階段,分別以電子器件、系統結構和計算模式的重大變革作為階段發展的標誌。而說到高性能計算的時候,我們第一反應能夠想到的,往往是類似於深圳超算中心配置的超級計算機,卻總是會忽略在上面跑的軟體。
  • 斬獲兩大殊榮 內蒙古超級計算機運算能力進入中國最強行列
    當天,內蒙古高性能計算公共服務平臺「青城之光」斬獲2020中國高性能計算機性能Top100第四名,國際人工智慧性能AIPerf500排行榜第六名。15日,2020中國高性能計算機性能Top100和國際人工智慧性能AIPerf500排行榜正式發布,和林格爾新區斬獲上述兩大殊榮。這意味著內蒙古超級計算機運算能力進入中國最強行列。
  • 比傳統超級計算機更強大 谷歌或在明年底前造出量子計算機
    9月2日消息,據《新科學家》報導稱,谷歌的研究人員或許將在明年底之前公布一款性能強大的量子計算機。這一領域的許多研究人員都表示,谷歌團隊距離項目的最終完成已經不遠。這或許將是全球最強大的量子計算設備。《麻省理工科技評論》去年訪問了谷歌的硬體實驗室,對谷歌的量子計算機項目進行了介紹。