2015年4月15日 — 中國北京 — 相較於當前的 Maxwell 處理器,NVIDIA 預計於明年推出的 Pascal 架構 GPU 將使深度學習應用中的計算速度加快十倍。
NVIDIA 聯合創始人、總裁兼執行長黃仁勳先生在於矽谷舉辦的 GPU 科技大會開幕主題演講活動上,對四千名與會嘉賓揭露 Pascal 架構的細節與處理器的最新發展藍圖。
他對聽眾們說:「得益於過去三年我們在研發工作上取得的成果,我們將從這個價值數十億美元的改良產品中獲益」。
深度學習指的是計算機使用神經網絡自主學習的過程,這個趨勢的興起讓 NVIDIA 又進一步改進了原本在去年 GTC 即公布的 Pascal 架構設計內容。
Pascal 架構 GPU 的三大設計特色將大幅加快訓練速度,精準地訓練更豐富的深度神經網絡,猶如人類大腦皮層的資料結構將成為深度學習研究的基礎。
再加上 32GB 的顯存(是NVIDIA 新發布的旗艦級產品 GeForce GTX TITAN X 的 2.7 倍),Pascal 架構可進行混合精度的計算任務。它將配備 3D 堆疊顯存,提升深度學習應用程式的速度性能多達5倍;另搭配 NVIDIA 的高速互連技術 NVLink 來連接兩個以上的 GPU,可將深度學習的速度提升達十倍。
在關鍵深度學習的任務方面,Pascal 架構的性能表現優於 Maxwell 架構
混合精度計算 – 達到更精準的結果
混合精度計算讓採用 Pascal 架構的 GPU 能夠在 16 位浮點精度下擁有兩倍於 32 位浮點精度下的速率的計算速度。
更出色的浮點計算性能特別提高了深度學習兩大關鍵活動:分類和卷積的性能,同時又達到所需的精準度。
3D 堆疊顯存 – 更快的傳輸速度和優秀的省電錶現
顯存帶寬限制了數據向 GPU 傳輸的速度。採用 3D 堆疊顯存將可提高比 Maxwell 架構高出三倍的帶寬和近三倍的容量,讓開發人員能建立更大的神經網絡,大大提升深度學習訓練中帶寬密集型部分的速度。
Pascal 採用顯存晶片逐個堆疊的技術,位置接近 GPU 而不是處理器板更往下的地方。如此就能把輸出在顯存與 GPU 間往返的距離從幾英寸減縮到幾毫米,大幅加快傳輸速度和擁有更好的省電錶現。
NVLink – 更快的數據移動速度
Pascal 架構加入 NVLink 技術將使得 GPU 與 CPU 之間數據傳輸的速度,較現有的 PCI-Express 標準加快5到12倍,對於深度學習這些需要更高 GPU 間傳遞速度的應用程式來說是一大福音。
NVLink 可將系統裡的 GPU 數量增加一倍,以共同用於深度學習計算任務上;還能以新的方式連接 CPU 與 GPU,在伺服器設計方面提供較 PCI-E 更出色的靈活性和省電錶現。