中國計量科學研究院先進測量工程中心副主任武彤:計算性能基準計量...

2020-12-12 中國IDC圈

中國IDC圈訊,開放數據中心峰會(ODCC2020)在北京召開,峰會圍繞數據中心新基建為主題,有數據中心領域及相關行業的眾多專家與會。在9月16日新技術與測試分論壇上,中國計量科學研究院先進測量工程中心副主任武彤帶來了主題為「計算性能基準計量測試工具研究」的演講。

中國計量科學研究院先進測量工程中心副主任武彤

大家好,我是武彤,先介紹一下我們單位的情況,可能在IT行業大家不太了解我們單位,我來自中國計量科學研究院,它隸屬於國家市場監督管理總局,是我國最高的計量科學的研究中心,國家級的法定計量技術機構,我所在的部門主要負責智能工程、雲計算以及數據中心領域還有一些其他的材料領域的計量測試以及評價驗證。

可能大家不太熟悉計量,我首先給大家介紹一下,大家對計量的概念一般都從秦朝開始,就是商鞅變法統一度量衡稱為計量。實際上在上古時代,《伏羲女媧圖》裡面拿了兩個工具就是比較早期的計量工具。什麼叫計量?給大家舉個例子,在秦朝叫秦錢,「秦錢半兩,徑一寸二分,重十二銖。」這兒都兩個單位「兩」和「銖」,一兩等於二十四銖,計量就是單位統一、量值準確可靠的活動。度量衡的技術進步開啟了我國的金融體系。

計量的發展通常我們稱為從古典計量到現代計量。古典計量基本上大家都非常了解,是用植物的果實或者是用某一個人的人體器官的長度作為計量的單位,比如說克拉,克拉就是是一種植物的果實,大家都用於做重金屬或者鑽石重量的計量,克拉原來是植物的果實,後來做標準化,1克拉等於200毫克。到1875年,米制公約的確立,為了工業製造的發展需要標準化,就需要統一的量值體系,到了現代計量,主要為了科學技術的發展,特別是軍事科學技術的發展。

我們看一下雲計算領域的計量。首先看貿易的角度,我們看怎麼來賣雲計算服務的,特別是IaaS的方面,這是騰訊雲的,裡面有三個指標,其中一個比較重要,一個叫CPU,一個叫內存,一個叫帶寬,它賣了三種服務,一個是計算的能力,一個是存儲的能力,一個是通信的能力,其他的廠商也是這樣的。

實際上如果從度量的角度來講,「核」就是一個單位,因為我們賣的計量單位是一核,一核的計量單位是多少我們大家都不是特別清楚。從計量角度來講,我們認為雲計算的計量可能處於植物果實的狀態,就是克拉的狀態。

在物理領域,計量有七個基本單位能描述整個物理世界,比如千克等等。在網際網路領域怎麼來描述整個網際網路領域的量呢?在2015年ODCA開放數據中心聯盟,這個聯盟大部分由數據中心的使用方組成的,他們做了研究成果就是IaaS的度量方法。他們提出來在網際網路領域可能用三個指標整個描述網際網路領域的活動:第一是秒,秒是時間的永恆的時間指標;第二是比特,大家知道比特是描述信息的一個計量單位;第三是計算能力,計算能力是網際網路領域一個新的計算指標,因為我們買的就是算力,類似於電力的千瓦時一樣。

實際上在這三個指標裡面,計算能力的測量是最複雜的。我們歸納一下,在網際網路測試領域怎麼做計量或者測試,比較重要的就是計算資源的測試,存儲資源的計量單位比如比特。存儲資源是計量是按照「塊存儲」來測量的,「塊存儲」的不同也會導致的計量測試結果差異很大,但計算資源的計量可能是顛覆性的差異,比如你買一核的算力是兩塊錢,另外一核可能二十塊錢,擔算力到底是多少,實際上是沒有一個統的度量指標的,所以我們就從需求的角度來講,最重要的需求是先把計算資源的這種計量的能力或者測量能力統一。

剛才我講物理計量用七個基本單位,但是在化學計量裡面,採用的計量標準叫標準物質。比如測氧氣的濃度97%是怎麼測量的呢?我們首先出一個標準物質,標準物質是4個9或者5個9的標準物質,跟它比較來的,根據比較的接過去確定是97%、96%。

在計算領域我們找到一些基準的測量程序,比如算π,每秒鐘算一百萬位是一核,兩百萬位是兩核,但實際的計算場景沒那麼簡單,但它的原理是這樣,靠基準程序來確定測試能力。

網際網路的處理數據非常複雜,你不可能找一個程序來度量整個能力,所以我們要找到一系列的程序,比如說負載壓縮的程序、流體力學的程序,計算負載越來越多,其測量的數據與網際網路的體驗就吻合得越好。當然它還需要其他的一些處理,比如說控制程序、硬體的操作。測試程序只是最基礎的單元測量能力,就像我們有了尺一樣,怎樣用尺來量面積,還需要有方法學的標準。

基本測試的工具有這麼多程序組成的,實際上我們在測量的時候,包括雲計算的廠商在測量的時候,它把這些東西裝入它的計算單元,通過運行來測量一個結果,這是各種各樣的基本測試程序。通過這個基本測試程序你能做出來一系列的測量結果,伺服器的算力和功耗之間的比值就是伺服器的能效,PUE是比較IT的耗電和總耗電,如果是伺服器的能效是提高了,實際上PUE的能耗高點也沒問題。從綜合能耗來講,伺服器的能效的提高,從實踐上來說它的技術進步更快,因為隨著半導體技術的進步,它的提高能力比數據中心的製冷的這種效率的提升速度是要快的,只不過大家更關注PUE的準確。

計算性能的測試需要很多策略,它並不是把一些負載堆積到一起就可以了,需要很多策略來支撐它,因為這種測試工具需要有很多指標證明它是科學的測量工具。

這是我們做的一款工具,大家看到的這是指標不是指現在的騰訊雲和阿里雲、百度雲的測量結果,這是我做實驗的時候它們的性能,今天只是展示一下這個結果用來說明怎麼判斷基準測試工具的科學性。

現在我解釋一下這種計量工具,基準測試工具怎麼才算是一個科學的測試工具?首要基準測量工具重複性要好,比如這個基準測量工具,你測量的結果是被測的計算單元的重複性加上工具的重複性的合成的結果。假定測量工具的重複性本身很差,這個測試工具不能作為基準計算測試工具,當然不同的負載它的重複性也是不一樣的,所以我們在選這種測試負載的時候要選重複性好的。這就是為什麼要選克拉作為鑽石的單位,克拉的種子可能一致性比較好,選蘋果就比較麻煩,有的大、有的小,所以選這個程序還是要從很多的負載裡面選擇重複性比較好的。

這種負載並不一定是我們實際使用的,基準測試實際上是一種理想測試,例如說我們每次看英特爾發布CPU說今年我們的計算性能提高40%,實際上它是在理想情況下也就是這種理想負載下做的,並不是在實際場景,你用WORD等應用程式體驗不到提升40%的體驗。

基準測試工具它是一個理想的測試工具,我們就選這麼多的負載首先來看它的重複性。重複性對基礎測試是最重要的指標,只有你把重複性確定了,你才能確認被測的樣品的一致性。假定我們的工具的一致性是0.2%,看一下單核心的測試結果,大家看雲計算如果是單核心它的重複性就比較好。

這是重複性的技術指標,大家可以看一下這個技術指標,騰訊雲整數運算的時候重複性是1.67%,浮點是1.06%。如果是共享計算單元,雲計算有很多共享的計算單元,它的重複性非常差,如果是共享的,別人用的多了可能縮減你的計算能力。實際上其他廠商也是類似情況,有的廠商可能會更差,核數多的重複性會更差,比如16核13.6%,它的算力是波動的,如果是獨享會好一點。每家廠商的計算能力實際上是波動的,並不是很穩定,我們買其他的東西也是一樣,我們買水果他每次給你稱500克也是波動的,有一個範圍,我們購買定量包裝的商品也是這樣。

這樣就有一個問題,我們怎麼樣來比較不同的算力,因為所有的算力都是波動的?

有一個概念叫不確定度,測量的「真值「實際上是不存在的。例如我們測量長度,測量長度假設1米,實際上它的最可能的範圍是呈正態分布的值,包含有不確定度。假定兩個人測量都是1米,這1米它不完全是相同,它有可能是正偏差,有的是負偏差,如果做可比較的話,就要把你測量結果的不確定度評估出來。我們有時候測量不確定度非常大,比如說算力不確定度達到30%,你測量一顆CPU算出來是2000,另外一個是1500,實際上比較不出來哪個算力更大。

今天大體來解釋一下做一個測量工具需要什麼樣的技術指標。

這是我們的不確定度,任何一個測量工具必須有包含不確定度的結果,它才是完整的測量結果,這個具體的不確定度的值我就不再具體解釋了。

總結一下,一個科學的基準測試工具需要有幾個方面的指標:

第一個是可測量,可測量是必須有值測量出來,不能給你給個感覺這個挺快、那個很慢,必須是有量值的;

另外一個可重複,每次的測量結果都在一定的範圍內是可以重複的。

另外是可以比較,就是我們設定兩種可以比較,比如單核的是什麼,雙核的是什麼,16核的是什麼,當然不是線性的。如果別人拿給你一個工具講不清楚這些指標,實際上你無法確定是不是可以用這個工具,當然你可以根據這個工具的發布方是不是權威的組織,來確定是不是相信它。

另外要完全釋放硬體性能,要準確模擬用戶的行為,我們選擇負載要有典型性,不能選一些很不常見的負載。

還有一個功能是引導未來軟體開發,基準測量工具是一個工具,它自己的穩定性實際上是非常高的,比一般測試程序的穩定性要求要高。你要是用應用軟體的時候,比如WORD,它每次裝載的時間都不一樣的,那個不一樣對你的體驗影響是很小,但是基準測量工具作為測量工具要求非常穩定。作為基準測量工具,我們認為這些指標是必須的,剛才有很多嘉賓來講核心的指標、實際上它都是用基準工具測量出來的,如果你的指標差異很大,基準測試工具的影響不明顯。如果差異很小,實際上影響很大的。

對於未來的考慮,我們希望能建立硬體的伺服器和雲計算的伺服器一致的測量工具,這種更便於比較。

我們的工作基本上來提供工具一致性,並不是說所有基準工具都是由我們發布,實際上基準的測試工具主要依靠廠商,我們來提供方法學的支持,怎麼來做一款基準測試工具,怎麼來評價基準測試工具。

我們自己也寫工具,我們自己寫的工具也不一定是最好的,這需要廠商共同的努力,剛才郭亮講也計劃在ODCC立一個項目是關於基準測試工具的,我們國家基準測試工具實事求是講,還是非常落後,這還有一段過程。

我們希望在ODCC的平臺下,我們國家的基準測試工具能夠獲得長足的進步,只有工具進步了,進行市場監管的時候才有基礎。比如有人投訴雲廠商,說我買的算力不夠,如果沒有基準測試工具很難判定怎麼叫不夠,你買了一核到底多少算力才夠。計量是技術合規的原點,市場監管的基礎。

謝謝大家。

相關焦點

  • 中國計量科學研究院鄭州中心花落高新區
    鄭州計量先進技術研究院(中國計量科學研究院鄭州中心)揭牌儀式日前在高新區舉行。鄭州市委常委、副市長谷保中,中國計量科學研究院副院長劉強共同為研究院揭牌。記者孫慶輝文/圖合作 鄭州市政府和中國計量科學研究院合作 翻開了新篇章鄭州計量先進技術研究院是鄭州市政府和中國計量科學研究院合作的載體,研究院的成立標誌著雙方合作開啟了新紀元。
  • 2014年度中國計量測試學會科學技術進步獎獲獎項目簡介
    中國計量科學研究院首次在國內研製成功了基於摻Er光纖飛秒雷射器的光學頻率梳,具有填補了國內摻Er光纖光梳的技術空白,滿足了國家波長基準量值溯源、時間頻率領域和其他相關領域的研究需要;實現了40dB的高信噪比系統頻移信號的輸出和光纖光梳7天以上長時間連續鎖定等多項創新點。
  • 中國計量院首席研究員原遵東榮獲「全國先進工作者」稱號
    為提升我國輻射測溫水平和能力作出突出貢獻中國計量院首席研究員原遵東榮獲「全國先進工作者」稱號□ 周禕寧11月24日,2020年全國勞動模範和先進工作者表彰大會在北京舉行。中國計量科學研究院(以下簡稱「中國計量院」)首席計量師原遵東榮獲「全國先進工作者」稱號。
  • 張工調研中國計量科學研究院並看望慰問院士
    張工調研中國計量科學研究院並看望慰問院士 2020-12-10 20:44 來源:澎湃新聞·澎湃號·媒體
  • 計量單位:告別實物基準,迎來自然常數
    今天,所有實物基準已退出歷史舞臺,光速等以量子物理為基礎的自然常數走上前臺,重新定義我們的「度量衡」。計量邁入量子化時代,世界測量技術規則將重構。這對我們影響幾何?中國又將如何應對?據國際計量局數據顯示,百年來各國保存的質量基準與大K的一致性發生了約0.05毫克的變化。「到底是各國保存的質量基準有問題,還是大K本身出現了問題,都不能確定。」中國計量科學研究院院長方向說。正如國際計量委員會副主席約阿希姆·烏爾裡希的比喻:大K「掉在地上碎了」,宇宙萬物的質量都會受到影響。
  • 計量單位:告別實物基準 迎來自然常數
    今天,所有實物基準已退出歷史舞臺,光速等以量子物理為基礎的自然常數走上前臺,重新定義我們的「度量衡」。計量邁入量子化時代,世界測量技術規則將重構。這對我們影響幾何?中國又將如何應對?據國際計量局數據顯示,百年來各國保存的質量基準與大K的一致性發生了約0.05毫克的變化。「到底是各國保存的質量基準有問題,還是大K本身出現了問題,都不能確定。」中國計量科學研究院院長方向說。正如國際計量委員會副主席約阿希姆·烏爾裡希的比喻:大K「掉在地上碎了」,宇宙萬物的質量都會受到影響。
  • 計量量子化時代到來,我們如何應對?
    今天,所有實物基準已退出歷史舞臺,光速等以量子物理為基礎的自然常數走上前臺,重新定義我們的「度量衡」。  計量邁入量子化時代,世界測量技術規則將重構。對我們影響幾何?中國又將如何應對?  據國際計量局數據顯示,百年來各國保存的質量基準與大K的一致性發生了約0.05 毫克的變化。「到底是各國保存的質量基準有問題,還是大K本身出現了問題,都不能確定。如果作為基準的大K本身出了問題,對自然界的衡量是不準確的。」中國計量科學研究院院長方向強調。正如國際計量委員會副主席約阿希姆·烏爾裡希的比喻:大K「掉在地上碎了」,宇宙萬物的質量都會受到影響。
  • 走進奮進中的中國計量專題片解說詞
    )值準確可靠的活動,計量(讀二聲——編者注)學是關於測量的科學。是所有科學技術賴以發展的支柱,沒有計量保障的測量數據是毫無意義、毫無價值的。從人們的日常生活、工業、商貿、醫療、國際貿易,到最尖端的科學和高新技術領域,計量時時刻刻都發揮著重要的應用。中國先哲孟子云:「不以規矩,不能成方圓」。前蘇聯科學家門捷列夫說:沒有測量就沒有科學。計量已成為促進社會發展、支撐科技進步、保障和改善民生的重要技術基礎。
  • 計量基準管理辦法
    第二條  本辦法所稱計量基準是指經國家市場監督管理總局(以下簡稱市場監管總局)批准,在中華人民共和國境內為了定義、實現、保存、復現量的單位或者一個或多個量值,用作有關量的測量標準定值依據的實物量具、測量儀器、標準物質或者測量系統。第三條  在中華人民共和國境內,建立、保存、維護、改造、使用以及廢除計量基準,應當遵守本辦法。
  • 張鍾華院士:難以計量的科技人生
    張鍾華院士,精密電磁測量專家,長期從事電磁計量基、標準的研究。1965年清華大學電機系研究生畢業,而後在中國計量科學研究院從事精密電測量工作至今。1995年當選中國工程院院士。 1965年,從清華大學電機系研究生班畢業後,張鍾華分配到中國計量科學研究院,從此開始了他漫長的計量科學之旅。
  • 昨天,計量單位"重新定義
    從「邁步定畝」「掬手為升」到「國際千克原器」,人類的計量單位度過了以物理實物來作為基準的漫長時期。今天,所有實物基準已退出歷史舞臺,光速等以量子物理為基礎的自然常數走上前臺,重新定義我們的「度量衡」。計量邁入量子化時代,世界測量技術規則將重構。這對我們影響幾何?中國又將如何應對?
  • 國家核電核島裝備產業計量測試中心(籌)赴中國測試技術研究院調研
    國家核電核島裝備產業計量測試中心(籌)赴中國測試技術研究院調研 2020-04-21 15:02:35
  • 計量基準、計量標準、工作用計量器具到底是個什麼關係?
    計量基準、計量標準和工作用計量器具說到底都是計量器具。什麼是計量器具呢?計量器具是單獨或與一個或多個輔助設備組合,用於進行測量的裝置。為了保證量值溯源的準確性和一致性,工作用的計量器具都需要進行量值溯源,溯源到國內唯一的源頭上,那麼這個源頭就是計量基準。但國家就一個源頭,如果只用這一個源頭去檢定所有的工作用計量器具是不可能的,時間不長基準就廢掉了。
  • 【計量知識】計量的分類
    、技術和行政管理的需要,由政府或官方授權進行強制管理的計量,包括計量單位、計量器具(特別是計量基準、標準)、計量方法以及計量人員的專業技能等的明確規定和具體要求。法制計量主要涉及安全防護、醫療衛生、環境監測和貿易結算等有利害衝突或特殊領域的強制計量。例如,關于衡器、壓力表、電錶、水錶、煤氣表、血壓計等的計量。2、科學計量科學計量主要是指基礎性、探索性、先進性的計量科學研究,例如關於計量單位與單位制、計量基準與標準、物理常數、測量誤差、測量不確定度與數據處理等。科學計量通常是計量科學研究單位,特別是國家計量科學研究機構的主要任務。
  • 計量的基礎知識
    即使是一國範圍 內統一計量制度,也只有藉助於政府的作用才可能實現。公元前 221 年,中國的秦始皇曾下詔全國統一度量衡就是一個明顯的例證。早期的計量相當於所指的法制計量,只是範圍較窄,主要限於與貿易和稅收有關的測量而已。計量管理工作的主要部分———法制計量,歷來是由 政府所主導的一項社會事業。大致 18 世紀開始,由於國 際貿易和科學技術的發展,歐洲國家之間出現統一計量 制度的需求。
  • 化學計量:精準感知世界 助力質量強國
    計量伴隨著科技進步不斷發展,已經成為檢驗科學發現、支撐產業發展、保障貿易公平、維護社會治理的重要基石。  中國計量科學研究院(以下簡稱中國計量院)作為我國的國家計量院,代表著我國物理、化學、生物等領域多個學科的最高計量能力,是我國計量科學研究和量值溯源體系的源頭與核心。
  • 瀘州儀器計量校準計量中心:推薦商家
    瀘州儀器計量校準計量中心:推薦商家 據法國媒體11月4日消息稱,法國警方4日傍晚在法蘭西島大區塞納聖旦尼省(Seine Saint Denis)逮捕了與尼斯聖母大教堂恐襲案相關聯的一名未成年男子。 2020-11-05 09:54
  • 國際單位制重大變革 助推計量邁入量子化新時代
    無處不在的精準測量,將直接促進市場公平交易、實現精準醫療、改善環保節能等等,將進一步促進社會誠信建設、降低社會管理成本,將惠及人類生產生活的方方面面,實現社會的全面進步。謝軍介紹,我國目前獲得國際互認的校準和測量能力已躍居全球第三、亞洲第一。我國自主可控的國家時間基準、長度量子基準都躋身世界先進行列。
  • 計量學基礎知識
    1.計量學    計量學是研究測量、保證測量統一和準確的科學。    計量學研究計量單位及其基準、標準的建立、複製、保存和使用;測量方法和計量器具的計量特性,測量的準確度,觀測者進行計量的能力以及計量法制和管理等。計量學也包括研究物理常數和標準物質、材料特性的準確測定。
  • 中國計量院成為全球重力加速度量值溯源地
    全球重力基準原點正式落戶中國北京中國計量院成為全球重力加速度量值溯源地本報訊 (莊 偉 馮金揚 記者史玉成)近日,全球計量領域頂級期刊《Metrologia》正式發布了中國計量科學研究院(以下簡稱中國計量院)主辦的2017年全球絕對重力儀關鍵比對(CCM.G-K2.2017)的最終結果