黃氏刀法 眼花繚亂!NVIDIA官方確認7nm安培首發割了一刀

2021-01-07 快科技

近日,NVIDIA正式揭曉了全新一代GPU架構「安培」(Ampere),其龐大的規模、精妙的架構令人驚嘆,同時不出意外、一如既往,首發核心又被割了一刀。

首先需要注意的是,不同於此前首發帕斯卡架構的Tesla P100、伏特架構的Tesla V100,這次的新計算卡被簡單地叫做「A100」,並沒有冠以Tesla的品牌序列,具體原因不詳,可能是想用於更廣泛領域。

與此同時,新的核心則被叫做「A100 Tensor Core GPU」,突出張量核心的關鍵作用,而核心代號按慣例延續為GA100。

GA100設計了8組GPC(GPU處理集群),每一組GPC裡又分為8組TPC(紋理處理集群),而每組又分為兩組SM(流式多處理器),然後每組SM包含64個FP32 CUDA核心(流處理器)。

這樣一來,一顆完整的GA100晶片就一共有128組SM、8196個流處理器,而這種分組結構和以往的NVIDIA GPU架構是一致的。

同時,每一組SM裡還有4個第三代Tensor核心,整顆晶片內共計512個,外部則搭配六顆HBM2顯存,每顆8GB,12個512-bit控制器,總位寬6144-bit。

另外,二級緩存從6MB猛增至40MB,每組SM單元的共享內存從最多96KB增至164KB、寄存器容量還是256KB,但整顆晶片寄存器達到27MB。

GA100晶片採用臺積電第一代7nm(N7)工藝製造,核心面積達826平方毫米,相比上代12nm GV100僅增大了11平方毫米(0.13%),但電晶體數量從211億個猛增至542億個,多了接近1.6倍,同時功耗控制在400W(增加33%),可見新架構和新工藝的威力。

如此龐大的核心在量產初期顯然會受制於良品率問題,所以實際使用的A100核心未達成完整規格,但和以往簡單屏蔽整組計算單元不同,這次砍得略有些複雜。

GPC單元屏蔽了整整一組,但剩餘的也並未全部開啟,其中兩組GPC也各自屏蔽了一個TPC(兩組SM),導致總的SM單元為108個、流處理器為6912個、Tensor核心為432個。

核心加速頻率1410MHz,比前兩代其實都低了,但整體性能在飛躍。

顯存也沒有逃過刀法,只開啟了五組HBM2,所以總容量為40GB,總位寬為5120-bit,頻率1215MHz,帶寬1555GB/s,比上代增加73%。

具體到每個SM單元,其中的Tensor核心數量雖然從8個減少到4個,但每一個每時鐘周期都支持多達256個FP16FP FMA操作,合計就是1024個,相比伏特、圖靈架構翻了一番。

新的Tensor核心還支持對所有數據類型加速,包括FP16、BF16、TF32、FP64、INT8、INT4、Binary。

更精細的專業細節這裡就不展開了,你們也沒啥興趣。

三代架構首發核心規模對比

相關焦點

  • Ampere安培後:NVIDIA下下代顯卡核心或代號Hopper
    來自國外的最新爆料稱,NVIDIA的下一代GPU核心架構是Ampere(安培),下下代將是Hopper,用於紀念Grace Hopper(格蕾絲·赫柏)。
  • Nvidia發力7nm顯卡,下一代GPU代號安培,網友:歐姆不配有名字?
    目前,晶片領域,7nm製作工藝的採用已經十分廣泛,但是在顯卡上卻還沒有進入7nm工藝時代。剛剛獲悉外媒報導,Nvidia計劃於2020上半年發布全新一代GPU,也就是下一代的CPU,代號「Ampere」安培。同時,外媒報導稱,下一代GPU或將採用7nm製作工藝。目前英偉達頂級的RTX系列的GPU,採用的是12nm製作工藝。
  • NVIDIA RTX 30系列架構詳解:8nm安培GPU的兩倍性能從何而來?
    在Ampere安培架構上,NVIDIA終於升級工藝了,只不過這次有兩個意外——首先沒有選擇臺積電,其次沒有上7nm,而是三星定製的8nm工藝,雖然跟7nm看起來只差了1nm,但實際上是兩代工藝。考慮到NVIDIA之前對工藝的表態,沒用7nm工藝而是三星8nm工藝又在意料之中,最關鍵的問題在於NVIDIA能夠做到多好。
  • Nvidia顯卡驅動翻車,偷CPU頻率!
    經過Nvidia的複查,該問題得到了確認,用戶們的感覺沒毛病,確實存在該問題!Nvidia顯卡xin'p最後再說說Nvidia吧,由於AMD的不給力這次Nvidia的吃相確實有點難看了,這黃氏刀法一出瞬間就多了N種規格的圖靈構架顯卡。真的希望AMD的7nm顯卡能夠給Nvidia點顏色看看啊!
  • 老黃髮力7nm顯卡,下代顯卡代號安培,網友:歐姆不配有名字?
    目前,晶片領域,7nm製作工藝的採用已經十分廣泛,但是在顯卡上卻還沒有進入7nm工藝時代。 剛剛獲悉外媒報導,Nvidia計劃於2020上半年發布全新一代GPU,也就是下一代的CPU,代號「Ampere」安培。
  • NV 7nm安培擁有540億電晶體:20倍算力、8路售價140萬元
    今晚NVIDIA就要正式發布7nm安培GPU了,CEO黃仁勳前兩天曝光了Tesla A100加速卡的真身,這兩天相關爆料也很瘋狂,EETimes發了一份詳細的報導,不過現在已經被刪除了,VC網站每次手快都能保存一份。
  • 黃仁勳或將在GTC 2020主題演講中公布新一代安培顯卡
    安培(Ampere)是英偉達即將推出的下一代顯卡。而關於安培顯卡的發布日期,也是一直有各種傳聞。  英偉達公司的官方博客/網頁昨日宣布,公司創始人兼CEO黃仁勳將於5月14日在YouTube上發布其GTC 2020主題演講(演講是事先錄製的)。
  • NVIDIA安培第一個跑分震撼出爐
    NVIDIA Ampere安培架構已經發布兩個多月了,相關伺服器產品越來越多,但在此之前,我們從未見過它的實際性能數據。現在,全息渲染公司OTOY的CEO Jules Urbach終於滿足了我們的好奇心。
  • 全新安培GPU架構來了!NVIDIA 5月14日發布黃仁勳演講
    受新冠疫情影響,NVIDIA一年一度的圖形技術大會GTC 2020一再推遲,最終無奈取消,改為新聞稿方式播出,萬眾期待的全新GPU架構「安培」(Ampere)也未能如期問世。今天,NVIDIA官方宣布,將於北京時間5月14日21點,以錄播的方式,放出創始人兼CEO黃仁勳的GTC 2020主題演講。NVIDIA表示,在這場原定於3月23日的演講中,黃仁勳會介紹公司在AI人工智慧、HPC高性能計算、深度學習、數據科學、自動駕駛、醫療健康、機器人、專業圖形等方面的創新。
  • NVIDIA宣布50多款安培伺服器:史上最大飛躍
    NVIDIA今天宣布,NVIDIA與全球領先伺服器製造商正在合作打造基於安培架構A100 GPU的高性能伺服器,包括各種不同設計和配置,可以應對AI、數據、計算等領域最複雜的挑戰。最多八顆惠與:ProLiant DL380 Gen10伺服器、Apollo 6500 Gen10系統浪潮:NF5468M5、NF468M6、NF5468A5採用PCIe A100,NF5488M5-D、NF5488A5、NF5488M6、NF5688M6使用8路NVLink,NF5888M6使用16路NVLink聯想:ThinkSystem SR670伺服器首發
  • 《天下第一》中練成雄霸天下的歸海一刀能否打贏鐵膽神侯?
    當然了還有歸海一刀,歸海一刀一心想著要報殺父之仇,所以不顧心愛的海棠的勸阻。歸海一刀為了報父仇,練了雄霸天下。這雄霸天下可是比霸刀還牛的刀法,當時歸海一刀使用霸刀都讓曹正淳讚嘆不已。雄霸天下刀法比霸刀還厲害,歸海一刀能否打贏當時的天下第一鐵膽神侯呢?
  • NVIDIA 461.09版顯卡驅動發布:修復GTX 750 Ti藍屏死機
    同時,新驅動在Windows 10系統裡還存在11個已知待修復的Bug,包括帕斯卡高刷筆記本在遊戲中隨機掉到60Hz、圖靈/安培顯卡搭配部分高刷G-Sync顯示器時待機功耗過高、全屏切換到窗口模式時G-Sync性能大幅下降,等等。
  • NVIDIA安培架構RTX 30系顯卡性能曝光:提升31%超給力
    網傳NVIDIA下一代安培設計方案Ampere(安培)GPU已經公布,但讓遊戲粉絲們魂牽夢縈的RTX顯卡還披著神秘面紗。據悉NVIDIA目前正在對RTX 30系列高端型號的設計進行評估,一款顯卡的誕生,仍然要經歷非常多的複雜步驟,至少也得三個月。
  • 英偉達明示RTX 3090大量細節,新一代安培架構顯卡9月登場
    撰文 | 澤南、力琴今年5月,英偉達在GTC大會上發布了最新的7nm安培架構,以及AI計算卡Tesla A100,但官方尚未透露關於消費級顯卡GeForce的消息。9月1日,英偉達即將舉辦一場GeForce特別活動,創始人黃仁勳也將發表演講。最近,外界洩露了不少的關於RTX 3000系列顯卡的信息。
  • 【簡訊】NVIDIA放棄Quadro專業顯卡品牌;華為Mate 40系列外觀官方...
    NVIDIA確認放棄Quadro專業顯卡品牌 日前,NVIDIA發布了基於安培架構的新一代專業顯卡RTX A6000、RTX A40,但不再冠以「Quadro」品牌,似乎已經棄之不用。
  • 來自540億電晶體的力量,全新NVIDIA安培架構和A100 GPU深入解讀
    實際上,從現有的安培架構的情況來看,現在發布的產品是徹徹底底針對計算市場的,不但大幅度加強了有關計算方面的內容、加入了大量特殊格式的計算加速、採用了全新設計的張量核心,還加強了雙精度計算的功能並且沒有提供任何光線追蹤加速的內容。這樣一來,未來安培架構圖形產品的情況就顯得頗為撲朔迷離了。
  • AMD首次確認big Navi用上RDNA2:能效提升50%、支持光追
    在GPU這方面,去年雖然推出了7nm Navi家族,不過第一代RDNA架構還是有不足,沒能掀翻旗艦卡市場,今年要看big Navi了,AMD已經確認它將使用RDNA2架構。在日前參加美國銀行的會議時,AMD CFO Devinder Kumar也回應了AMD在Radeon顯卡上的計劃,他提到了big Navi顯卡,表示它會使用RDNA2架構,這也是AMD高管首次官方確認這件事,雖然本來也不意外。
  • NVIDIA安培旗艦RTX 3090功耗350W?實際比圖靈還低 AMD還怎麼打
    儘管NVIDIA嚴查,但是最近一段時間安培遊戲顯卡的偷跑還是相當嚴重,而且可信度也比較高,其中首發的主要是高端顯卡,使用GA102核心,至少有RTX 3090、RTX 3080 Ti、RTX 3080顯卡,RTX 3090將取代之前Titan顯卡的位置。
  • RTX 30安培旗艦卡跑分首曝!31%的提升何等酸爽
    首先可以確認,基於安培架構的GA102大核心,在遊戲卡領域將有至少三款型號,最高端的可能叫RTX 3090或者RTX Titan,次之的可能叫RTX 3080 Ti或者RTX 3080 Super,再次之的則是RTX 3080。
  • 華為Mate 20將首發7nm麒麟980處理器,電池增大,安卓9.0系統
    XDA網站日前洩露了華為Mate 20及Mate 20 Pro的部分規格,它們將首發7nm工藝的麒麟980處理器,性能提升20%,同時配置4200mAh大電池,支持無線充電,還會用上基於安卓9.0的EMUI 9.0系統。