NV 7nm安培擁有540億電晶體:20倍算力、8路售價140萬元

2020-11-25 驅動之家

今晚NVIDIA就要正式發布7nm安培GPU了,CEO黃仁勳前兩天曝光了Tesla A100加速卡的真身,這兩天相關爆料也很瘋狂,EETimes發了一份詳細的報導,不過現在已經被刪除了,VC網站每次手快都能保存一份。

關於7nm安培GPU架構上的改進,之前的爆料主要是提到了遊戲及光追上的變化,EETimes的爆料主要設計HPC及AI運算上的,AI算力提升了20倍,雙精度性能2.5倍提升。

他們援引NVIDIA官方消息稱,安培GPU的AI算力提升了20倍,因為它專門使用了被稱為TF32的第三代Tnesor Core,還支持FP64運算,這是HPC應用的關鍵升級,使得這一代GPU的雙精度計算性能大幅提升。

性能提升的後果就是GA100核心依然龐大,上代的GV100核心是840mm2、211億電晶體,現在的GA100大核心是540億電晶體,核心面積還沒信息,不過超過800mm2應該沒懸念,因為7nm相比12nm的電晶體密度也就翻倍而已,電晶體將近2.6倍規模,核心面積小不了。

除了計算卡本身,NVIDIA CEO黃仁勳之前重點展示的也是新一代DGX A100超算,使用了8路Tesla A100顯卡,性能可達5PFLOPS,不僅支持AI運算,還能擴展支持數據分析等常規應用。

NVIDIA表示,1個DGX A100超算就能替代25個數據中心機架伺服器,只需要1/20的功耗及1/10的投資。

雖然Tesla A100還沒發布,但是DGX A100超算系統已經開始出貨了,一套售價20萬美元,約合140萬人民幣——裡面有8塊Tesla A100加速卡,還有龐大的散熱及處理器、PCB等部件,假設2/3的成本來自加速卡,那麼算下來每塊Tesla A100也要1.6萬美元。

相比之下,之前的Tesla V100加速卡售價最高在1萬到1.2萬美元之間(8000美元的版本也有),這也意味著新一代顯卡至少漲價50%,更可能的漲幅是100%,畢竟三年沒升級了,性能大增,售價自然要上一個臺階。

相關焦點

  • 來自540億電晶體的力量,全新NVIDIA安培架構和A100 GPU深入解讀
    整個GA100 GPU中包含了542億個電晶體,封裝面積為826平方毫米,每平方毫米電晶體數量約0.656億個,即65.6MTr/平方毫米。 從數據來看,7N工藝的電晶體密度數據極為接近臺積電7nm HP工藝的65MTr/平方毫米。7nm HP工藝的其他的參數還包括金屬層76nm、鰭片高度為30nm、柵極間距為64nm、採用了7.5T庫等。
  • 從540億個電晶體的安培架構,解密英偉達的人工智慧野心!
    全新Ampere(安培)到來正如此前所預計的一樣,黃仁勳在此次演講中介紹了全新的Ampere(安培)架構,這一架構用以替代使用了接近兩年的伏特(Volta)架構。值得注意的是,全新的Ampere(安培)架構主要用於人工智慧,數據中心等專業用途,而不是用於遊戲顯卡,這一情況與上一代的伏特(Volta)架構如出一轍。
  • 英偉達扔出20枚「AI核彈」!540億個電晶體的GPU,一個機櫃秒數據中心
    2、發布首款基於安培架構的7nm GPU——NVIDIA A100 GPU,包含超過540億個電晶體,AI訓練峰值算力312TFLOPS,AI推理峰值算力1248TOPS,均較上一代Volta架構GPU提升20
  • NVIDIA RTX 30系列架構詳解:8nm安培GPU的兩倍性能從何而來?
    在Ampere安培架構上,NVIDIA終於升級工藝了,只不過這次有兩個意外——首先沒有選擇臺積電,其次沒有上7nm,而是三星定製的8nm工藝,雖然跟7nm看起來只差了1nm,但實際上是兩代工藝。考慮到NVIDIA之前對工藝的表態,沒用7nm工藝而是三星8nm工藝又在意料之中,最關鍵的問題在於NVIDIA能夠做到多好。
  • 深扒英偉達安培新架構,五大技術新招刀刀見血
    以多GPU配置的集成底板形式出現的伺服器構建塊HGX A100最高可以組成擁有10 PFLOPS算力的超大型8-GPU伺服器。集成了8個A100的AI系統DGX A100單節點算力達5 PFLOPS,售價19.9萬美元。
  • 英偉達八代GPU史上的超級大飛躍 較前一代圖靈架構性能提升20倍
    近日,英偉達 CEO 黃仁勳正式發布了新一代 GPU 架構 Ampere 安培,這是英偉達推出的第八代 GPU 架構,較前一代 2018 年發布的圖靈架構性能提升高達 20 倍。據悉,英偉達每代顯卡架構均以頂級科學家命名,這一次以法國物理學家安培命名。
  • 英偉達安培第二代RTX架構GPU搭載了280億個電晶體 採用三星8nm工藝
    英偉達安培第二代RTX架構GPU搭載了280億個電晶體 採用三星8nm工藝 來源:IT之家 • 2020-09-02 15:33:11
  • 7nm物理極限!1nm電晶體又是什麼鬼?
    適用了20餘年的摩爾定律近年逐漸有了失靈的跡象。從晶片的製造來看,7nm就是矽材料晶片的物理極限。不過據外媒報導,勞倫斯伯克利國家實驗室的一個團隊打破了物理極限,採用碳納米管複合材料將現有最精尖的電晶體製程從14nm縮減到了1nm。那麼,為何說7nm就是矽材料晶片的物理極限,碳納米管複合材料又是怎麼一回事呢?
  • 所謂7nm工藝製程,是電晶體之間的間距,還是電晶體的尺寸呢?
    我們力圖用相對簡單的語言,讓大家通俗易懂的了解下,到底什麼是所謂的7nm工藝製程?以及為什麼有一段時間,大家都說7nm工藝是極限呢?我們先看一張圖:(圖源來自於:《 5nm就到極限了嗎?談晶片工藝發展路向》)這張圖其實已經很明顯的解釋了,什麼是nm工藝?你可以看到Gate,中文意思是門的意思,在這裡指的是柵極(Source:源極 ,Drain:漏極)。
  • 老黃髮力7nm顯卡,下代顯卡代號安培,網友:歐姆不配有名字?
    目前,晶片領域,7nm製作工藝的採用已經十分廣泛,但是在顯卡上卻還沒有進入7nm工藝時代。 剛剛獲悉外媒報導,Nvidia計劃於2020上半年發布全新一代GPU,也就是下一代的CPU,代號「Ampere」安培。
  • Nvidia發力7nm顯卡,下一代GPU代號安培,網友:歐姆不配有名字?
    目前,晶片領域,7nm製作工藝的採用已經十分廣泛,但是在顯卡上卻還沒有進入7nm工藝時代。剛剛獲悉外媒報導,Nvidia計劃於2020上半年發布全新一代GPU,也就是下一代的CPU,代號「Ampere」安培。同時,外媒報導稱,下一代GPU或將採用7nm製作工藝。目前英偉達頂級的RTX系列的GPU,採用的是12nm製作工藝。
  • 老黃確認:英偉達新款遊戲卡和計算卡全部採用安培架構
    IT之家5月14日消息 根據外媒VideoCardz的消息,黃仁勳確認新款安培架構將用於遊戲卡和計算卡,而上一代的計算卡和遊戲卡架構是不同的,分別是伏特和圖靈。黃仁勳表示,這將簡化英偉達GPU陣容。外媒爆料稱,GA100擁有540億個電晶體,是Volta GV100的兩倍多。在AI訓練(單精度操作)方面,新款GPU的能力將是Volta的20倍。在高性能計算(雙精度運算)方面,新款GPU將會達老款2.5倍。
  • 超算大陸IPFS雲算力新品即將上市,開啟穩健投資方式!
    Filecoin於2017首次公開發行,募集超過2.5億美元,堪稱史上最大規模的ICO。FIL代幣將根據進度逐步發放,共計20億枚,自2020年10月主網上線以來,FIL幣價最高達1200元。IPFS雲算力產品也隨著這股熱潮,受眾多投資者追捧。
  • 英偉達明示RTX 3090大量細節,新一代安培架構顯卡9月登場
    撰文 | 澤南、力琴今年5月,英偉達在GTC大會上發布了最新的7nm安培架構,以及AI計算卡Tesla A100,但官方尚未透露關於消費級顯卡GeForce的消息。9月1日,英偉達即將舉辦一場GeForce特別活動,創始人黃仁勳也將發表演講。最近,外界洩露了不少的關於RTX 3000系列顯卡的信息。
  • RTX 30系列顯卡依然沿用三星8nm工藝
    而同為安培架構的GA100計較卡焦點用的即是臺積電7nm工藝,集成540億電晶體,機能非常壯大。因此玩家有望RTX 30 GPU改換成臺積電7nm工藝的呼聲不停於耳。在10月份的時分也有信息稱,NVIDIA思量來歲轉產臺積電7nm。
  • NVIDIA發布PCIe版安培計算卡:功耗驟降150W、性能20倍於上代
    5月中旬,NVIDIA正式發布了全新一代「安培」(Ampere) GPU架構、GA100 GPU核心,並宣布了首款產品「A100」加速計算卡,採用專有的SMX4形態。今天,基於標準PCIe形態的A100計算卡登場了,更適合主流標準伺服器。
  • 看看7nm和10nm的晶片,差距到底多大?
    眾所周知,晶片都是製作的越小越好,據了解,晶片是由電晶體組成的,製程越小,同樣面積的晶片裡,電晶體就越多,自然性能就越強了。像是現在的晶片廠商都在追求更小的製程,比如臺積電去年就邁入了7nm時代,而明年或會邁入5nm時代,目前的三星是8nm,中芯國際是28nm。看似不大的差距,那麼像7nm的晶片和10nn的晶片相比,差距到底有多大呢。
  • 算力1000倍,能耗1%,彎道超車?不服就幹
    導讀:光子晶片已經產生了突破,原型晶片已經做出,後面就是解決製作工藝問題,由於其算力超高,所以對於加工精度要求就低,一旦突破,從設計到製作,國內可以自己完成,拜託對外國的依賴。光子晶片大幅度提高算力的情況下,在相同面積下,不用集成那麼多器件,所以加工精度要求就降低了。但是之後可能會在光子晶片這個賽道重新比賽,加工精度重新提高。