雖然NVIDIA正式公布新一代的GeForce遊戲卡應該要等到下周科隆遊戲展前的「GeForce Gaming Celebration」活動,但是在昨天正式開幕的SIGGRAPH 2018,這場圖形界頂級大會上,NVIDIA是不可能空手到來的,而事實上他們昨晚確實有很多重量級的公布,包括全新的Turing架構(注意,官博現在還沒有使用任何中文命名),包括第一張專用於光線追蹤的GPU:Quadro RTX,但是我們還是應該從它的根基:新的Turing架構開始說起。
NVIDIA的官方直播大概是早上的8:45結束的,現在還有很多細節沒有公布出來,所以我們先來看看官方的Newsroom,首先關於Turing架構,NVIDIA對其非常有自信,稱其為自從2006年通過統一渲染架構帶來CUDA後最偉大的飛躍,所以你可想而知NVIDIA對其的期望,或者說野心。新的Turing架構很重要的一點就是混合渲染(Hybrid Rendering)來實現光線追蹤,具體來說包括引入全新的RT Core來加速光線追蹤,還有我們已經在Volta架構看到的Tensor Core來加速AI處理,當然還有光柵化,畢竟現在我們還沒有厲害到能夠拋棄光柵化的程度,所以新的Turing架構是包含多種力量的,而這種包含多方力量來實現光線追蹤的混合渲染,應該會成為日後的關鍵詞。
每次有新架構到來,我們最關心的就是微架構級別的變化:有哪些新增的特性,有哪些精簡的部分,如果說Volta架構我們開始看到Tensor Unit,那麼新的Turing架構當中最重要的就是新引入的RT Core。既然是「RT」,顧名思義就是衝著光線追蹤(Ray Tracing)來的,它的作用是用來加速處理光線在三維環境中的傳播,處理光線的速度是目前Pascal架構的25倍,同時讓GPU作為節點處理最末幀(Final Frame)的效果渲染要比將CPU作為節點的速度快30倍。
同時讓人興奮的是,自從Volta架構開始引入的Tensor Core,我們都知道它能提供遠遠高於傳統GPU的人工智慧、深度學習性能,這部分性能能夠賦予我們的GPU去做很多以往沒有的工作,比如說在Turing架構當中的Tensor Core,能夠在每秒處理500萬億的張量運算,通過這部分性能,我們能實現以往無法奢望的功能,比如說新的基於深度學習的抗鋸齒技術:DLAA(Deel Learning Anti-Aliasing,萬物基於深度計算)。
最後在傳統的架構方面,Turing在我們熟悉的SM單元當中新增整數處理(Integer Unit)單元,以及新的統一緩存架構,能夠帶來目前架構兩倍的帶寬。規格方面,Turing架構能夠搭載最多4608 CUDA,並且能夠帶來最高16 TFlops浮點性能。