遇事不決,量子力學。
這雖然是網際網路上大家的調侃,卻也看出網友們對「量子」相關的高科技缺乏認知。但其實「量子」概念無處不在,甚至就我們日常接觸的所有物品來說,都存在「量子」的含義——按照物理學的說法,所有材料都是由原子組成,微觀上由量子力學決定。
比如我們「量子計算機」的名字許多業內人都聽說過,按照中國科學院院士郭光燦的話說就是「從經典信息技術時代跨越到量子信息技術時代」的標誌。而另一個我們經常聽到的就是「量子材料」的概念,它由納米材料演變而來,但在內容上更加寬泛。
中國科學院物理研究所 (以下簡稱「中科院物理所」) 就正在進行與量子材料相關的材料基因組項目研究。與許多人印象中材料研究所需要採用的瓶瓶罐罐不同,如今的中科院物理所更多地藉助高性能計算特別是其中的「高通量計算」分支來進行理論推理,通過建立高通量材料基因計算和數據處理平臺並基於材料基因資料庫與雲資源平臺為全國範圍內的更多材料研究人員提供數據共享服務。
這才能夠體現出高性能計算的價值。雖然目前以人工智慧為代表的高性能計算應用被許多網際網路企業所領銜,但是在純科研領域,高性能計算依然是科研人員的主要手段,而包括我們本次介紹的高通量材料研究在內的許多科研應用都可以通過計算機模擬,從而節省大量的實驗時間和複雜的、重複計算勞動力。
就以「高通量材料基因計算」為例——普通計算強調的是計算效率,即所謂的「算得快」。但是高通量計算更看重「算得多」這一能力,也就是在提升工作任務並行度,及其處理海量數據時的吞吐量上下功夫。基於此,高通量計算平臺往往在並行處理性能、平均響應時間、吞吐率、擴展性以及成本等方面有著更高,或更為嚴苛的要求。
這也勢必對計算平臺提出了嚴苛的挑戰,上述問題我們可以從四個方面來剖析——
所謂「並行處理性能」,則要求強大計算能力、高主頻的處理器,因為越是高端的處理器越具備更多的核心數量,也就符合大規模並行處理的要求;
所謂「平均響應時間、吞吐率」則涉及到處理器和網絡設備兩部分的互聯互通。一方面,在處理器內部數據要實現高帶寬的快速傳輸,這樣就需要一款超大容量L3緩存的處理器;而對於處理器與網絡設備的傳輸來說,則需要更高帶寬、低延遲的網絡予以配合;
相對上面兩個難題來說,「擴展性」可能是最容易解決的問題,因為主流高性能計算應用的x86平臺都具備了強大的擴展性和易用性,可以根據客戶需求搭建不同規模的集群,提供強大算力。
最後,在成本的考量方面,即便目前高性能計算中也有使用非x86架構甚至ARM架構平臺的產品(比如世界排名第一的日本富嶽超級計算機),但是這些設備在平臺優化和應用部署上都需要專業的人員參與調配,這樣就會帶來成本的巨額提升。因此如果考慮成本的話,主流x86平臺依然是高性能計算應用的最佳選擇。
戴爾易安信PowerEdge伺服器
綜合上述痛點和需求,最終中科院物理所選擇了戴爾易安信提供的全套解決方案。該方案基於英特爾二代英特爾至強可擴展處理器和英特爾Omni-Path架構網絡鎖構建,通過英特爾特色的關鍵計算與高速互連技術,融入戴爾獨有創新功能和特性,最終通過戴爾易安信PowerEdge伺服器、戴爾易安信PowerVault ME4系列和Isilon系列存儲設備與方案來呈現。
其中,PowerEdge伺服器是戴爾易安信面向主流x86市場提供的伺服器產品系列,包括了單路、雙路、多路等多種形態,也有面向高性能計算應用的多節點系列產品,滿足客戶的不同需求。除此之外,並PowerEdge伺服器還憑藉高度可擴展的體系結構和靈活的內部存儲,為廣泛多樣的應用程式提供更高性能支持。藉助於「預裝 Vmware 虛擬化軟體,自帶雲基因」,「高可擴展性的業務體系結構」,「智能自動化,易於遠程運維」等特點,PowerEdge伺服器也能夠大力加速企業的 IT 轉型和業務創新 。
戴爾易安信PowerVault ME4系列存儲
而戴爾易安信PowerVaultME4系列和Isilon系列存儲則是戴爾易安信專門面向中小企業應用打造的產品,同樣搭配了英特爾至強系列處理器,並針對 SAN/DAS進行了優化,還可以支持各類驅動器類型、多種協議和全包式軟體功能,並提供大量擴展存儲模塊選項,非常適於加速高性能計算、備份、VDI等企業級應用程式的性能,適配中科院物理所的應用環境綽綽有餘。
同時,為幫助中科院物理所應對某些特定場景對計算性能的更高需求,英特爾也為其推薦了英特爾至強鉑金9242處理器。這款處理器集成了48個核心,支持 96 個線程的高並發,並支持12通道的DDR4內存,能夠以更強悍的算力,支持中科院物理所在材料基因算法優化、基於機器學習及深度學習的材料特性預測等應用上開展更多探索。
如今,中科院物理所已在其高通量材料基因計算新平臺上完成了160個英特爾至強金牌6230R 處理器節點、20個高性能英特爾至強鉑金9242處理器節點的部署,並在材料基因數據處理平臺所在的數據中心中構建了完整的統一分級存儲資源池,以及用於資源共享的數據云平臺。
上述節點全部投入使用後,預計每天可執行 3000個基於 DFT理論的作業任務,完成 100-700 個 (視材料複雜度不同)無機晶體材料的基因計算,全年即可完成目前人類已知的所有無機晶體材料 (去重後約 10 萬個) 的計算。而在此後的三到五年內,中科院物理所還將利用新平臺提供的上述計算能力,對人類未知材料世界繼續展開探索,將50萬個未知材料的預測數據納入平臺的材料資料庫中,從而將材料研究方法由傳統的「發現-計算」轉變為「計算-發現」,使信息技術真正轉變為新材料研究的強大驅動力。
在本次升級之後,中科院物理所也獲得了業界領先的、面向未來材料基因計算和數據研究的全新處理平臺,不僅達成了提升材料基因計算效率的主要目標,也兼顧了為廣大材料研究人員提供完整、齊備的共享材料基因資料庫的需求。
作為中國首屈一指的材料科學研究與應用機構,中科院物理所致力於運用高通量計算方法開展新材料研究,並已取得豐碩成果,在超導體、納米以及動力電池等材料方向上獲得了諸多突破。為此也就更需要以更強、更高效的計算力,構建完備的材料基因數據平臺,幫助研究人員省去繁瑣的計算環境採購、搭建工作,讓他們能將更多精力聚焦於材料研究本身。
我們常說,科學技術是第一生產力,而事實上在科研應用中,計算力就是第一生產力。藉助於戴爾易安信提供的全新計算平臺、藉助於英特爾至強可擴展處理器和Omni-Path架構網絡,中科院物理所的科學家們也可以放開手腳,不再被以往的計算力所束縛,邁向科研殿堂更高的臺階。