英偉達下一代Pascal GPU架構應用計算速度快十倍

2020-12-05 3DMGAME

2015年4月15日 — 中國北京 — 相較於當前的 Maxwell 處理器，NVIDIA 預計於明年推出的 Pascal 架構 GPU 將使深度學習應用中的計算速度加快十倍。

NVIDIA 聯合創始人、總裁兼執行長黃仁勳先生在於矽谷舉辦的 GPU 科技大會開幕主題演講活動上，對四千名與會嘉賓揭露 Pascal 架構的細節與處理器的最新發展藍圖。

他對聽眾們說：「得益於過去三年我們在研發工作上取得的成果，我們將從這個價值數十億美元的改良產品中獲益」。

深度學習指的是計算機使用神經網絡自主學習的過程，這個趨勢的興起讓 NVIDIA 又進一步改進了原本在去年 GTC 即公布的 Pascal 架構設計內容。

Pascal 架構 GPU 的三大設計特色將大幅加快訓練速度，精準地訓練更豐富的深度神經網絡，猶如人類大腦皮層的資料結構將成為深度學習研究的基礎。

再加上 32GB 的顯存（是NVIDIA 新發布的旗艦級產品 GeForce GTX TITAN X 的 2.7 倍），Pascal 架構可進行混合精度的計算任務。它將配備 3D 堆疊顯存，提升深度學習應用程式的速度性能多達5倍；另搭配 NVIDIA 的高速互連技術 NVLink 來連接兩個以上的 GPU，可將深度學習的速度提升達十倍。

在關鍵深度學習的任務方面，Pascal 架構的性能表現優於 Maxwell 架構

混合精度計算 – 達到更精準的結果

混合精度計算讓採用 Pascal 架構的 GPU 能夠在 16 位浮點精度下擁有兩倍於 32 位浮點精度下的速率的計算速度。

更出色的浮點計算性能特別提高了深度學習兩大關鍵活動：分類和卷積的性能，同時又達到所需的精準度。

3D 堆疊顯存 – 更快的傳輸速度和優秀的省電錶現

顯存帶寬限制了數據向 GPU 傳輸的速度。採用 3D 堆疊顯存將可提高比 Maxwell 架構高出三倍的帶寬和近三倍的容量，讓開發人員能建立更大的神經網絡，大大提升深度學習訓練中帶寬密集型部分的速度。

Pascal 採用顯存晶片逐個堆疊的技術，位置接近 GPU 而不是處理器板更往下的地方。如此就能把輸出在顯存與 GPU 間往返的距離從幾英寸減縮到幾毫米，大幅加快傳輸速度和擁有更好的省電錶現。

NVLink – 更快的數據移動速度

Pascal 架構加入 NVLink 技術將使得 GPU 與 CPU 之間數據傳輸的速度，較現有的 PCI-Express 標準加快5到12倍，對於深度學習這些需要更高 GPU 間傳遞速度的應用程式來說是一大福音。

NVLink 可將系統裡的 GPU 數量增加一倍，以共同用於深度學習計算任務上；還能以新的方式連接 CPU 與 GPU，在伺服器設計方面提供較 PCI-E 更出色的靈活性和省電錶現。

相關焦點

英偉達發布新一代GPU架構用於數據中心,遊戲玩家得再等等

5月14日晚，英偉達在線放出了其年度GTC大會主題演講，正式發布了其最新圖形晶片NVIDIA A100，該晶片為首個基於安培（Ampere）架構的計算晶片產品，定位數據中心的AI、通用運算、數據分析、科學計算與雲端影像分析等用途，採用臺積電7納米製程。
亞馬遜加持,英偉達A100 GPU將無人匹敵?

2020年10月，英偉達A100 在MLPerf基準測試中創下最新記錄，目前已經可以在亞馬遜雲端進行訪問。十年過去了，英偉達現在正在為AWS提供硬體，為下一代開創性的創新提供動力，這是相當有歷史意義的。在今年的MLPerf中，A100在數據中心推斷方面的表現超過cpu達237x。單個NVIDIA DGX A100系統(帶有8個A100 gpu)在某些AI應用上可以提供與近1000臺雙插槽CPU伺服器相同的性能。
英偉達Turing架構Quadro系列GPU國內首次亮相

DoNews8月24日消息（記者程侃如）8月23日，英偉達在第二十七屆北京國際廣播電影電視展覽會上介紹了採用全新Turing架構的全球首款光線追蹤GPU：NVIDIA？ Quadro？ RTX？ GPU，並演示適用於廣電傳媒娛樂領域各類專業工作流程的技術與應用。
蘇姿豐發布RDNA2架構RX 6000系列新顯卡,與英偉達RTX 3000決戰...

這三款顯卡都是基於 AMD 最新的 RDNA 2，該技術已經應用到了 PS5和 Xbox Series x 中。這些最新的 Radeon 卡將支持下一代遊戲所需的光線追蹤等。 AMD 表示，新顯卡在4K 和1440p 遊戲中可以與 Nvidia 並駕齊驅。
「史上最強」再進一步,英偉達發布科研級 GPU

2020 年 11 月 16 日，今日英偉達發布 A100 80GB GPU，該產品支持英偉達 HGX AI 超級計算平臺，且內存比上一代產品提升一倍，面向研究人員和工程師提供空間速度與性能，助力實現新一輪 AI 和科學技術突破。
pascal

最新消息顯示三星與NVIDIA的晶圓代工合作基本告吹，14nm FinFET工藝生產GPU沒戲了，NVIDIA的Pascal架構
英偉達證實Pascal與Turing兩代GPU將共存!

鑑於圖靈（Turing）發布初期的定價很高，很多人猜測英偉達（Nvidia）並不急於清退上一代 10-系帕斯卡（Pascal）產品。在最近的花旗全球技術大會上，Nvidia 財務長 Colette Kress 證實了兩代 GPU 架構將會共存的消息。
英偉達八代GPU史上的超級大飛躍較前一代圖靈架構性能提升20倍

近日，英偉達 CEO 黃仁勳正式發布了新一代 GPU 架構 Ampere 安培，這是英偉達推出的第八代 GPU 架構，較前一代 2018 年發布的圖靈架構性能提升高達 20 倍。據悉，英偉達每代顯卡架構均以頂級科學家命名，這一次以法國物理學家安培命名。
英偉達Volta架構深度解讀:專為深度學習而生的Tensor Core到底是...

之後，英偉達開發博客又更新了一篇深度解讀文章，剖析了 Tesla V100 背後的新一代架構 Volta，其在提供了更好的高性能計算支持之外，還增加了專門為深度學習所設計的 Tensor Core。機器之心在本文中對這篇博客文章進行了編譯介紹，同時還在文中加入了一些機器之心對英偉達應用深度學習研究副總裁 Bryan Catanzaro 的採訪內容。
NVIDIA或推Volta架構GPU 但GTX 2080仍是Pascal架構

有外媒透露NVIDIA計劃在今年發布其新世代基於12nm工藝的Volta架構GPU，但Fox Bussiness說NVIDIA的下一代顯卡（GTX20系列）依然會使用Pascal架構，以及通用計算超算、機械學習、人工智慧等方面。
關於NVIDIA 安培架構 GPU最新講解!下周一直播,快上車～

巔峰贅婿原標題：關於NVIDIA安培架構GPU最新講解！下周一直播，快上車～5月14日，在GTC2020上，NVIDIA新一代GPU架構「安培（Ampere）」正式發布，同時推出首款基於安培架構的GPU——NVIDIAA100。
從540億個電晶體的安培架構,解密英偉達的人工智慧野心!

值得注意的是，全新的Ampere（安培）架構主要用於人工智慧，數據中心等專業用途，而不是用於遊戲顯卡，這一情況與上一代的伏特（Volta）架構如出一轍。同時，英偉達也宣布，首款基於Ampere（安培）架構的GPU A100已全面投入生產，並交付給全球的客戶。
雙倍的性能,雙倍的快樂:英偉達RTX 30系顯卡架構解析

架構的革新：CUDA數量大幅提升對於新一代顯卡來說，架構的改進能夠極大地提升顯卡的性能，而光線追蹤遊戲的加入又讓英偉達的顯卡在架構上有著革命性的變化，這種變化在20系顯卡中就已經初顯端倪，英偉達在20系顯卡中除了傳統的FP32計算單元之外也額外加入了RT計算單元以及Tensor Core計算單元
英偉達下一代顯卡統一用臺積電5nm工藝

目前英偉達已經正式發布了30系顯卡，採用的是三星的8nm製程工藝，不過在實際運行的時候卻發現，三星8nm工藝對於顯卡的超頻能力並沒有多大的幫助，30系顯卡普遍超不上去，而且三星的良率也滿足不了消費者的需求，因此現在30系顯卡仍在搶購之中，作為三星製程的大客戶之一，英偉達顯卡對此並不滿意，有消息稱英偉達希望下一代顯卡的製程工藝重新變為臺積電的架構，而製程則提升至5nm。
英偉達停產麥克斯韋架構顯卡為新一代顯卡鋪路

【環球科技綜合報導】據美國科技網站EXTREME TECH報導，3月英偉達的帕斯卡架構在2016年的遊戲開發者大會(GDC)上嶄露頭角，但其並未透露更多新一代顯卡的詳細信息，令許多讀者對此感到不快。有傳言說為了使帕斯卡架構GP104核心快速取代GM204核心，英偉達可能停產GTX 980 Ti、980及970。
永久免費使用谷歌GPU?英偉達可能要發布專用於挖礦的GPU

另一方面，面對免費GPU，英偉達並無畏懼，還有消息傳出，3月份GTC大會該公司會發布一條挖礦專線。訓練模型，無疑是機器學習中最耗費時間和成本最高的部分。在GPU上訓練模型可以將訓練速度提升接近40倍，將2天的訓練時間減少到幾個小時。但是——提升速度通常意味著你要花錢。
英偉達新架構發布,除商用處理之外,還關心遊戲顯卡能否站穩腳跟

北京時間的5月14日，我們的老朋友，被網友們戲稱為刀法精湛的英偉達創始人，黃仁勳——當然網友更樂意叫他老黃，通過在線視頻的方式，發布了GTC2020的演講，在演講上，最重磅的產品莫過於發布了英偉達最新的7納米顯卡架構，即第三代安培架構，號稱光追性能翻倍，不少網友發出感慨，難道RTX3060
NVIDIA革命性新GPU架構「帕斯卡」:兩個新技術絕了!-NVIDIA,Pascal...

GeForce GTX Titan Z是克卜勒架構的登峰造極之作，麥克斯韋架構即將進入Tegra移動產品線，NVIDIA的下一代GPU架構也已經呼之欲出了，這就是劃時代的「Pascal」(帕斯卡)。根據路線圖，它將在2016年推出，仍然是兩年一代的節奏。
老黃確認:英偉達新款遊戲卡和計算卡全部採用安培架構

IT之家5月14日消息根據外媒VideoCardz的消息，黃仁勳確認新款安培架構將用於遊戲卡和計算卡，而上一代的計算卡和遊戲卡架構是不同的，分別是伏特和圖靈。黃仁勳表示，這將簡化英偉達GPU陣容。從消費者的角度來看，這應該能讓他們更容易地理解英偉達GPU系列。IT之家了解到，英偉達CEO黃仁勳將在北京時間5月14日晚 9 時發表GTC 2020主題演講，感興趣的小夥伴可在英偉達官網觀看直播。預計黃仁勳將會公布GA100 GPU。外媒爆料稱，GA100擁有540億個電晶體，是Volta GV100的兩倍多。
英偉達扔出20枚「AI核彈」!540億個電晶體的GPU,一個機櫃秒數據中心

A100利用了英偉達安培架構的設計突破——成為首個內置彈性計算技術的多實例GPU，提供了NVIDIA迄今為止最大的性能飛躍——統一了數據分析、訓練和推理，將AI訓練和推理性能提高到上一代的20倍，將HPC性能提升到上一代的

英偉達下一代Pascal GPU架構 應用計算速度快十倍

相關焦點

英偉達發布新一代GPU架構用於數據中心,遊戲玩家得再等等

亞馬遜加持,英偉達A100 GPU將無人匹敵?

英偉達Turing架構Quadro系列GPU國內首次亮相

蘇姿豐發布RDNA2架構RX 6000系列新顯卡,與英偉達RTX 3000決戰...

「史上最強」再進一步,英偉達發布科研級 GPU

pascal

英偉達證實Pascal與Turing兩代GPU將共存!

英偉達八代GPU史上的超級大飛躍 較前一代圖靈架構性能提升20倍

英偉達Volta架構深度解讀:專為深度學習而生的Tensor Core到底是...

NVIDIA或推Volta架構GPU 但GTX 2080仍是Pascal架構

關於NVIDIA 安培架構 GPU最新講解!下周一直播,快上車～

從540億個電晶體的安培架構,解密英偉達的人工智慧野心!

雙倍的性能,雙倍的快樂:英偉達RTX 30系顯卡架構解析

英偉達下一代顯卡統一用臺積電5nm工藝

英偉達停產麥克斯韋架構顯卡 為新一代顯卡鋪路

永久免費使用谷歌GPU?英偉達可能要發布專用於挖礦的GPU

英偉達新架構發布,除商用處理之外,還關心遊戲顯卡能否站穩腳跟

NVIDIA革命性新GPU架構「帕斯卡」:兩個新技術絕了!-NVIDIA,Pascal...

老黃確認:英偉達新款遊戲卡和計算卡全部採用安培架構

英偉達扔出20枚「AI核彈」!540億個電晶體的GPU,一個機櫃秒數據中心

英偉達下一代Pascal GPU架構應用計算速度快十倍

英偉達八代GPU史上的超級大飛躍較前一代圖靈架構性能提升20倍

英偉達停產麥克斯韋架構顯卡為新一代顯卡鋪路