華為發布全世界最快AI產品,集成1024顆業內最強晶片,訓練ResNet-50隻需59.8秒

2021-02-13 量子位
乾明 李根 發自 凹非寺 
量子位 報導 | 公眾號 QbitAI

不止5G和鴻蒙,華為最新大招,扔出AI計算核彈。

剛剛,華為全聯接大會開幕,推出又一重量級AI產品Atlas900

此前接受外媒採訪時,任正非就已經預告:這是「目前全世界最快的AI平臺」。

全球最快是多快?

華為給出數據——訓練ResNet-50只需59.8秒

在同等精度上,比排名第二的選手快15%。

華為副董事長胡厚崑說,如此算力還可以廣泛應用到科學研究與商業創新中,比如天文探索、氣象預測、自動駕駛、石油勘探等領域。

與此同時,華為方面也宣布:Atlas900的相關集群服務,也會以極優惠的價格向全球科研機構和大學開放。

伴隨該產品發布,華為還披露了整體計算戰略,這也是華為首次對外公開這一戰略。

集成數千顆算力最強AI晶片

Atlas 900由數千顆昇騰910組成,算力能達256~1024 PFLOPS@FP16。

訓練ResNet-50隻用了59.8秒的集群規模,用到了1024顆昇騰910。

實際應用中表現也非常亮眼。在天文領域,能夠將傳統169天的任務,縮短到10秒02。

昇騰910晶片亮相於去年的全聯接大會,今年8月正式商用,是全球第三款、中國首款AI訓練晶片。

昇騰910採用華為自研的達文西架構,號稱「算力最強的AI處理器」,7nm工藝製程,最大功耗為350W,實測310W。

該晶片跑分對標也很明確。直接對標英偉達Tesla V100,主打深度學習的訓練場景,客戶面向AI數據科學家和工程師。

晶片如何強悍?華為同樣給出了「吊打」友商的數據:

相同的功耗下,昇騰910的算力是V100的兩倍,訓練速度更快,用戶需要得出訓練產出的時間會更短。在典型案例下,對比V100,昇騰910的計算速度可以提升50%-100%。

而伴隨著Atlas 900的發布,華為的計算版圖宣告正式構建完成,全面邁入落地階段。

華為將如何落地?怎樣驅動落地?華為現在也全盤託出。

華為計算戰略首次披露

整體來看,華為的計算戰略以「晶片」為核心,一共分為四大部分,囊括晶片技術,整體規劃,商業策略以及生態建設:

首先,是架構創新。

核心面向投資基礎研究,比如達文西架構,重點解決全場景智能的架構問題。

其次,是全場景晶片,也就是處理器族。

目前,華為一共有4大晶片系列,其中包括面向通用計算的鯤鵬系列,面向AI的昇騰系列,面向智能終端的麒麟系列,以及面向智慧屏的鴻鵠系列。

胡厚崑說,將來還有一系列處理器,面向更多的場景。

第三是商業策略,有所為有所不為。

華為也再次明確了自己的晶片商業模式,硬體開放、軟體開源,使能應用開發和遷移。

但晶片不直接對外銷售,以雲服務和部件的形式面向客戶,優先支持合作夥伴發展整機。

最後,構建開發生態。

在這一步,華為倡導開放,更新沃土計劃,目標是未來5年,投入15億美元,匯聚500萬開發者,來使能全球合作夥伴發展應用及解決方案。

這些背後,是新的商業機遇和更大的空間。華為,早已不再是一個銷售通信設備的供應商。

胡厚崑開場即強調,之前華為被人以「聯接」認知,但新時代新階段面臨新機遇,華為如今要面向智能產業,打造從聯接到計算的宏偉藍圖。

華為怎麼看未來?

不僅僅只是發布戰略,胡厚崑也披露了背後的邏輯,並給出預判。

他說,隨著計算模式不斷演進,面向機器學習的計算已成為主流。

但現在,計算正在進入智能時代,其具備三大特徵:暴力計算、從中心側、到端側無處不在的泛在計算,以及端邊雲高效聯動的協同計算。

最好的解決方式是,在中心節點暴力計算,訓練通用模型,在邊緣進行個性化部署。

但是,想要實現這一規劃,仍舊面臨著不少難點,比如能夠支持全場景智能計算的新架構,這是當前計算產業發展面臨的巨大挑戰,同時也是巨大的機會。

到底有多大?

胡厚崑援引了Gatener報告——全球計算產業總空間為兩萬億美元。

在他看來,這是一片大藍海,華為將堅定在計算領域的投入,並推進落地。

回應吹下的牛:AI落地進展

在現場,華為也對去年吹下的牛,給出答辯。

2018年全連接大會,華為發布全棧全場景AI戰略,而計算,正是這一戰略的基石與核心。

今天,胡厚崑答辯心態,交出一年落地成績單:年8月份,伴隨著昇騰910以及MindSpore發布,華為的AI解決方案已經搭建完成。

全棧來看,華為已經擁有了昇騰處理器系列IP和晶片、晶片使能CANN(晶片算子庫和高度自動化算子開發工具)、應用使能ModelArts及訓練和AI框架MindSpore。

全場景角度來看,昇騰處理器的產品和解決方案,已經覆蓋了雲、邊、端。在華為雲上,提供了相應的推理和訓練服務。

Atlas系列板卡、模組和伺服器已經上市。搭載昇騰系列處理器,已經廣泛應用在華為的智慧型手機上。

而且, 華為也將進一步介紹了通用計算的落地狀況,總共分四步走:

首先,打造有競爭力的通用計算處理器。

其次,持續投資板卡、伺服器、作業系統、資料庫、編譯器等關鍵技術和產品,打通生態全鏈條,完成系統級驗證,幫助合作夥伴更好地銷售整機。

第三,華為與夥伴合作共同打造鯤鵬產業生態基地,目前已落地北京、上海、重慶、深圳、成都等城市,在平臺搭建、培養人才、應用示範等領域開展全面合作。

而且,這些產品不僅僅只在中國。

之前華為就透露,基於鯤鵬處理器的系列產品、解決方案和服務,將面向全球市場,起於中國,服務全世界。

華為副董事長說:華為有AI,華為在務實落地,大家可以放心跟華為合作。

你怎麼評價華為這次扔出的「核彈」?

相關焦點

  • 斯坦福DAWNBench最新訓練排名!華為雲ModelArts用時10分28秒獲全球最快
    這是今年華為最新發布的AI開發平臺,可以提供包括數據標註準備、模型訓練、模型調優、模型部署等AI應用開發服務。其中,模型訓練更是在發布之時就備受關注。因為華為雲稱,ModelArts可以在模型訓練階段通過各類優化技術,尤其通過級聯式混合併行技術,在同樣的模型、數據集和同等硬體資源情況下,模型訓練耗時都能大幅縮短。
  • 全球首顆:集成PD協議全同步數字解調無線充電TX晶片發布!
    貝蘭德科技順應行業趨勢,推出了全球首顆集成PD協議全同步數字解調無線充電TX晶片D9620,支持PD、QC、AFC輸入,無線充發射功率高達15W,集成度高,輕鬆滿足行業趨勢需求。全球首顆!貝蘭德發布PD協議全同步數字解調無線充TX晶片D9620
  • 全球最快AI訓練集群Atlas 900發布,華為的AI野心有多大?
    華為副董事長胡厚崑透露,Atlas 900匯聚了華為幾十年技術積累,是當前全球最快的AI訓練集群,由數千顆昇騰處理器組成。 事實上,人工智慧已成華為發展的核心戰略之一。華為創始人任正非此前在內部講話時稱,5G只是一個工具,支撐的是人工智慧,人工智慧才是大產業,才是華為發展的戰略要地。 華為在AI領域的野心和魄力由此可見一斑。
  • 深度解讀華為雲AI戰略:如何靠AI贏得下一個十年?
    更多優質內容請關注微信公眾號「AI 前線」(ID:ai-front) 總體來說,華為人工智慧的發展戰略是以持續投資基礎研究和 AI 人才培養,打造全棧全場景 AI 解決方案和開放全球生態為基礎。所謂全棧,是從縱向的技術功能視角來看,包括晶片、晶片使能、訓練和推理框架、應用使能在內的全堆棧方案。
  • 寒武紀7nm訓練晶片思元290及玄思1000加速器正式亮相
    思元290智能晶片是寒武紀的首顆訓練晶片,採用臺積電7nm先進位程工藝,集成460億個電晶體,支持MLUv02擴展架構,全面支持AI訓練、推理或混合型人工智慧計算加速任務。寒武紀玄思1000智能加速器,在2U機箱內集成4顆思元290智能晶片,高速本地快閃記憶體、Mellanox InfiniBand網絡,對外提供高速MLU-Link™接口,打破智能晶片、伺服器、POD與集群的傳統數據中心橫向擴展架構,實現AI算力在計算中心級縱向擴展,是AI算力的高集成度平臺。
  • 矽谷初創公司Cerebras發布史上最快AI計算機
    谷歌、Facebook、OpenAI、騰訊、百度等許多其他科技巨頭都認為,如今人工智慧的基本限制是訓練模型需要很長時間。因此,縮短訓練時間等於消除整個行業進步的主要瓶頸。當外界不斷追求晶片小型化、低功耗時,這顆晶片企業反其道而行之,採取了一種新穎的方法,把所有的數據保存在一個巨大的晶片上,讓系統就可以更快地運行,該公司於今年8月推出了有史以來製造的最大的晶片-晶圓規模引擎(WSE)。WSE將邏輯運算、通訊和存儲器集成到單個矽片上,是一種專門用於深度學習的晶片。
  • 華為終於全力自主研發「中國人自己的」 AI 晶片了!
    華為不僅正式發布了 AI 發展戰略與全棧全場景 AI 解決方案,還帶來了兩款全新的 AI 晶片 —— 昇騰 910 和昇騰 310。任正非先生的「晶片急是急不來的」之語言猶在耳,便見華為終於全力自主研發「中國人自己的」 AI 晶片了!
  • 英集芯推出集成Type-C協議的TWS充電盒SOC晶片IP5333
    也就是說一個充電盒內部至少要有三顆晶片才能實現全部功能。非常繁瑣。 多顆晶片的解決方案,在這個缺芯的當下,缺點也凸顯出來。 業內領先電源晶片廠商英集芯科技,近期發布一款全集成TWS充電倉SoC晶片IP5333。
  • 華為大重磅!首款搭載鴻蒙的行動裝置或將誕生,麒麟1020採用5納米製程,年度旗艦機即將面世
    華為有望最快在9月份發布旗艦機Mate40系列,搭載麒麟1020晶片。運行鴻蒙OS 2.0的Mate Watch智能手錶或同時發布。
  • 嵌入式AI簡報2020-11-30: 華為Bolt發布1.0/NanoDet/MicroNet/ImgTech新AI加速器IP
    並打算實現20nm晶片的自主製造和量產,為此需千億級別的投入;聯發科:將通過旗下子公司立錡併購Intel旗下Enpirion電源管理晶片產品線,原產品線針對FPGA、車用低功耗平臺等的電源管理模塊;聯發科:預告一款6nm製程普及型高端平臺SoC,基於A78新架構的MT6893Z/CZA,3GHz主頻、Mali-G77MC9 GPU方案;
  • 射頻晶片揭秘:5G時代晶片之王
    根據集成方式的不同可分為DiFEM(集成射頻開關和濾波器)、 LFEM(集成射頻開關、低噪聲放大器和濾波器)、 FEMiD(集成射頻開關、濾波器和雙工器)、 PAMiD(集成多模式多頻帶PA和FEMiD)等模組組合。持續增加的射頻前端器件數量和PCB板可用面積趨緊之間的矛盾促進射頻前端模組化發展, 越來越多的分立式射頻前端晶片通過SiP技術封裝在同一顆大晶片裡面。
  • 華為WiFi 6+技術發布:凌霄650與麒麟W650協同,峰值速率2400Mbps!
    2月24日晚間消息,華為終端在線上發布會上正式發布了自研的WiFi 6+技術,並曝光了兩款自研的WiFi 6晶片:凌霄650和麒麟W650。
  • 對待喪心病狂的美國政客只能以實力說話 華為誓師在晶片領域挑戰高通
    上周三,華為在上海發布兩款人工智慧晶片昇騰910和310,兩款晶片分別針對數據中心和智能硬體而設計。兩款晶片發布後,外媒紛紛將其解讀為華為意在追趕高通和英偉達兩家主要的半導體晶片企業。隨後,華為CEO徐直軍發布了包括「打造全棧方案」在內的五項AI戰略,並宣布將在未來推動自身晶片產業發展。華為昇騰910主要應用於數據中心。
  • 爭霸 | 一文盡觀英偉達、谷歌… 2018 決戰AI芯 !
    閱讀關鍵詞:AI晶片、GPU、CPU、FPGA、TPU、雲側、端側 2018年AI晶片主要有兩個戰場:雲側推理/訓練和端側推理/訓練
  • 訓練可視化工具哪款是你的菜?MMCV一行代碼隨你挑
    在深度學習中可視化模型的訓練過程有助於我們分析模型的狀態。可視化訓練過程的庫很多,我們將一些常用的庫集成到 MMCV 中方便用戶使用。在 MMCV 中使用這些庫只需簡單配置。在本文中將介紹這些庫以及它們在 MMCV 中的使用方法。
  • 把AI建在赤道上!徐直軍發布華為AI戰略及全棧全場景方案
    在大會開幕演講中,徐直軍分享了華為對AI發展的觀點與判斷、系統闡述了華為的AI發展戰略並發布全棧全場景AI解決方案,其中包括全球首個覆蓋全場景AI的昇騰(Ascend)系列IP和晶片。1971年,英特爾發布了第一顆微處理器。50多年來,摩爾定律見證了ICT產業的蓬勃發展。如果我們把AI產業和ICT產業這六十年的發展軌跡畫到一起,那麼大致應該是圖中的樣子。概括來說,人工智慧與ICT產業的總體發展水平密切相關,學術研究發現和工程技術發展相輔相成。
  • 微軟發布視覺模型ResNet-50
    ▲微軟視覺模型ResNet-50是一個應用最新理念的預訓練ResNet-50模型,上面以七個流行的計算機視覺基準(ImageNet,CIFAR-10,CIFAR-100,STL-10,SVHN,CUB,Flowers-102)的平均分數來衡量預訓練視覺模型可以加速深度學習研究,並使生產中執行計算機視覺任務的成本降低。
  • 深度學習第19講:CNN經典論文研讀之殘差網絡ResNet及其keras實現
    ))(X_shortcut)    X_shortcut = BatchNormalization(axis = 3, name = bn_name_base + '1')(X_shortcut)            X = Add()([X, X_shortcut])    X = Activation('relu')(X)        return X殘差網絡 resnet50
  • 剛剛,英偉達發布全球最強AI訓練器HGX-2,可替換300個CPU伺服器
    剛剛,在臺灣的GTC發布會上,黃教主將這個被稱為全球最強的AI訓練器——HGX-2,推向了市場。這是全球首個融合人工智慧和高性能計算的計算平臺。是的,就是下邊這個龐然大物了👇作為一個多功能計算平臺,HGX-2的首個計算產品就是今年三月在GTC矽谷大會上亮相的全球最大GPU——DGX-2。
  • 世界著名半導體晶片廠商排名及介紹
    英特爾,營收額313.59億美元2. 三星,營收額192.07億美元3. 德州儀器,營收額128.32億美元4. 東芝,營收額101.66億美元5. 意法半導體,營收99.31億美元6. Renesas科技,營收82.21億美元7. AMD,營收額74.71億美元8.