RTX2080與RTX2080Ti最新架構Turing(圖靈)詳細介紹

2021-01-18 客機說科技

RTX2080與RTX2080Ti最新架構Turing(圖靈)詳細介紹

掐指一算,距離NVIDIA發表GeForce GTX 1080已有2年以上的時間,Pascal架構同時具備高效能與能源效率,繼任者有何表現相當令人期待。Turing架構不僅包含傳統光柵化運算特化的硬體單元,更有加速光追蹤技法的RT單元,以及機器學習Tensor單元。此次NVIDIA宣布利用Turing架構推出GeForce RTX 2070、GeForce RTX 2080、GeForce RTX 2080 Ti共3款顯示卡,首先由GeForce RTX 2080作為先鋒,於9月20日上市,GeForce RTX 2080 Ti則延遲至9月27號,GeForce RTX 2070將於10月發售。

英偉達圖靈構架

Turing設計不僅包含更新過的SM核心設計,另外針對市場應用趨勢,加入特化的硬體加速單元,Tensor核心用以執行與機器學習高度相關的矩陣運算,RT核心則負責光追蹤運算當中,佔有重要地位的BVH和光線與物件三角形互動。作者手中也拿到GeForce RTX 2080、GeForce RTX 2080 Ti兩款產品,就讓我們抽絲剝繭,從設計到硬體,從硬體到效能一層層揭開面紗。

RTX2080

相對比帕斯卡構架Turing最大的改變就是SM核心的設計改變,Turing架構之中,每個TPC內部包含2個SM,並根據顯示卡等級不同調整數量,譬如Quadro RTX 6000為TU102最完整的36個TPC、GeForce RTX 2080 Ti則削減為34個TPC、GeForce RTX 2080的TU104再減為23個TPC。Turing構架每個TPC內部共有2個SM,並改善SM內部架構組成,官方表示相對於Pascal架構版本,單一CUDA核心的運算效能提升50%(Pascal單一TPC僅包含1個SM)。

規格對比圖

其中有2個主要的進步,第一是為新增獨立的整數資料路徑,讓整數指令可以隨著浮點資料路徑一同處理;過去的架構則存在整數與浮點數互斥的狀況,當執行整數指令時,指令配發器並沒有辦法浮點運算工作給後端的運算單元。第二為SM記憶體架構更新,變更為共享式記憶體架構,Pascal為L1 24KB和96KB共享記憶體,Turing SM將2者結合成單一區域,並依據實際運算所需,分成64KB+32KB或是32KB+64KB,存取L1頻寬同時上升至2倍,L1的容量最高也多出1.7倍。

RTX2018對比2080

Turing SM相較Pascal SM改良L1架構,變更為共享式記憶體,能夠分配成64KB+32KB或是32KB+64KB,並提升L1存取頻寬至2倍,L2同時加大1倍容量至6MB。每個SM包含64個FP32核心、64個INT32核心、8個Tensor核心、1個RT核心(Pascal缺少後3者,單一SM包含128個FP32核心);以目前遊戲運算平均值,大約每100個浮點運算指令,就有36個整數運算指令,整數運算多為記憶體定址和擷取資料工作,浮點運算則為比較、最大值、最小值等數學運算。整數與浮點運算能夠同步作業,相對而言浮點數效能提升36%。

RTX2080遊戲實測

Tensor機器學習,NVIDIA在Volta架構首次導入用於機器學習的專用處理單元Tensor,這次也放入Turing架構當中,並隨著Microsoft發表DirectML,未來Tensor能夠以硬體加速完成相關作業。對於遊戲來說,也可以期待與電腦AI對戰時,遇到更為千變萬化的戰略。Tensor除了可以支援FP16浮點數運算,Turing更加入INT8和INT4的支援能力,讓可以容忍較低精度的應用提升處理速度。Tensor針對機器學習經常使用的矩陣運算最佳化,單一SM內部包含8個Tensor核心,每個時脈周期可以完成512個FP16乘法與積運算,或是總額1024個浮點運算,將精度調低至INT8則能夠完成2048個運算。

RTX2080遊戲實測

Tensor以硬體加速方式完成NVIDIA自己的NGX,包含近期轟炸各位腦袋的深度學習超取樣反鋸齒,原本利用著色器運算效能進行的反鋸齒技術,將部份工作轉移至Tensor核心進行。透過機器學習訓練,DLSS可以提供比TAA更高的畫面品質,或是在減少輸入樣本的情形之下,提供與TAA相同的4K畫面品質,卻只要TAA一半的運算資源。但缺點是,DLSS需要經過機器學習訓練這一道關卡,因此並非所有遊戲均支持。

圖片來源於網絡,如有侵權,聯繫作者刪除。

相關焦點

  • RTX 2080TI顯卡的圖靈架構是什麼?
    9月20全新一代顯卡即將同步發售了,自2080ti顯卡發布以來持續熱議,除了被吐槽的煤氣灶外形,更多的還是對性能的期待。性能的大幅升級之外,新一代顯卡最大的變化還是架構的更新。全新的圖靈架構,是新款顯卡的秘密武器。
  • 耕升RTX2080Ti 炫光 OC評測:光影很炫 實力很強
    【PConline 評測】要說這次RTX系列顯卡哪家廠商出的顯卡外觀改變最大,耕升出品的RTX2080(Ti)炫光 OC系列絕對是排的上號的。耕升RTX2080Ti 炫光 OC使用了極具辨識度的外觀設計,貫徹了菱形的元素,不少網友也反饋這款顯卡是首發RTX顯卡中最酷炫的。今天曉邊就評測一下這款顯卡,看看它酷炫的外表下實力如何。
  • 索泰推RTX2080Ti 水冷極光版 引入全新設計元素
    根據官方的消息,索泰RTX2080Ti-11GD6 PGF極光 OC水冷顯卡正式發布,另外官方還暗示還有三款GTX新甜品周五發布,應該就是GTX 1660Ti了。 據介紹,索泰這款全覆蓋式水冷模組,引入了全新設計元素。
  • AMD Radeon RX5900:光線追蹤+雙倍RX5700XT性能,挑戰RTX2080ti
    251mm / 7nm / 103億RX5500XT:158mm / 7nm / 64億RadeonVII:331mm / 7nm / 132億RX590:232mm / 12nm / 57億RTX2080ti
  • NVIDIA 2080/2080Ti評測!12年等來了什麼
    Turing圖靈架構的四個基本特徵● 圖靈架構的基本組成既然是全新一代架構,又被NVIDIA如此看重,我們自然要好好聊聊。首先從命名方式上來說,圖靈指的是人類計算機科學之父、人工智慧之父:艾倫·麥席森·圖靈(Alan Mathison Turing),其最有名的莫過於圖靈測試,人工智慧只有通過這個測試才能真正的被人們賦予「智能」二字。
  • 寫在RTX2080評測之前:老黃想用AI/光線追蹤顛覆顯卡?
    不過今晚NVIDIA解禁了圖靈顯卡的技術細節,我們可以從技術角度來看看圖靈GPU架構到底帶來哪些改變?核心完整版是4608個CUDA核心,不過RTX 2080 Ti現在只使用了4352個,從3584到4352意味著CUDA核心數增加了21%,這個增幅並不算高,因為圖靈這一代的CUDA架構著重於提升性能,NVIDIA宣稱每個CUDA核心的性能提升了50%。
  • 更好的輕奢甜品 七彩虹iGame RTX 2080 Advanced OC評測
    【IT168 評測】自RTX 20系顯卡上市,可以說給沉寂已久的DIY市場帶來了新的活力,雖然自上一代10系顯卡發布已經等待了長達兩年多,但毫無疑問,20系顯卡搭載的全新的圖靈架構、實時光線追蹤和DLSS等技術將會帶來全新的遊戲方式和極致的體驗。而在諸多首批上市的非公版顯卡中,今天就為大家帶來七彩虹的iGame RTX 2080 Advanced OC的詳細評測。
  • RTX2080顯卡三大新賣點的背後:老黃又要改變遊戲規則了
    【PConline 雜談】隨著NVIDIA在幾天前的SIGGRAPH 2018大會上正式發布Turing圖靈架構,首發Quadro RTX 8000/6000/5000三款顯卡,這兩天的科隆遊戲展上NVIDIA還會推出遊戲顯卡GeForce RTX2080/2070,意味著2018年顯卡市場上終於有了全新一代的顯卡,而這距離GTX10系列顯卡上市已經兩年多了
  • Nvidia GeForce RTX系列和圖靈架構:您需要知道的一切
    代號為圖靈,新一代的第一波浪潮為遊戲玩家帶來了無與倫比的真實感,但這些GPU也在很大程度上體現了Nvidia對人工智慧和超級計算的看法。小編已經在小編的實驗室中擁有了三個中間的新GeForce RTX 2080。這款GPU以Zotac Gaming GeForce RTX 2080 Amp顯卡的形式出現在小編面前。
  • 拒絕遊戲低畫質 顯卡顯示器兩手抓_影馳 GeForce RTX 2080Ti HOF...
    藍寶石RX 5700 8G 天貓券後2499元        藍寶石RX 5700 8G採用全新的RDNA圖形架構,擁有2304個流處理單元        影馳RTX 2070 星曜使用了圖靈架構核心代號TU106晶片,顯存為三星的8G GDDR6,顯存位寬256bit,基礎頻率1410MHz,加速頻率1620MHz。性能強悍,追求光追的朋友可以看看。
  • 4599元體驗RTX2080的性能!七彩虹iGame RTX 2070 Super Vulcan X...
    在3DMark Time Spy測試中,2K解析度下,iGame RTX 2070 Super的成績比公版足足高了630分,與公版RTX 2080非常接近。在4K解析度下,比公版高了260分,與RTX 2080之間的差距剛好是100分。
  • 比RTX 2080 Ti快17%?「AMD Radeon(TM) Graphics」現身OpenVR
    自從RTX 2080 Ti推出以來,它一直都佔據著遊戲顯卡中的王座,沒人能撼動其半分。不過這個寶座可能會被AMD奪去,因為日前有細心的Reddit網友發現,VR跑分平臺OpenVR上出現了一張名為AMD Radeon(TM) Graphics的顯卡,其跑分居然比RTX 2080 Ti要高出17%之多。這張神秘的顯卡在OpenVR上得分為103.32,而RTX 2080 Ti則為88.10,兩者均為在1512*1680的解析度下進行測試的。
  • 相當於3個RTX 2080 Ti
    現在回到Intel Xe顯卡這裡,最高2048個EU執行單元,16384個核心,整體規格是i7-1065G7的32倍,換算下來至少相當於12288個圖靈流處理器,也即是2.8個RTX 2080 Ti。2048個EU的Intel Xe顯卡單精度浮點性能為36 TFlops,和RTX 2080 Ti的13.4 TFlops單精度浮點性能比起來,二者之間正好也是2.7倍的差距。時隔12年,Intel再次回到獨顯領域的決心非比尋常,我們也相信Intel有實力能在獨顯方面挑戰NVIDIA的壟斷地位!畢竟在一家獨大的情況下,消費者已經是很難買到便宜的顯卡了。
  • 最新圖靈架構顯卡快來了解一下!
    北京時間8月21號凌晨0點,英偉達在德國科隆發布了最新的2080/2080TI顯卡。新一代GPU採用的是全新圖靈架構,支持RTX實時光線追蹤技術,支持11GB GDDR6顯存。作為傳統的板卡大廠技嘉科技第一時間也推出了對應的2080/2080TI系列產品。技嘉科技在新的一代圖靈架構顯卡上採用5支軟磁粉複合式熱管,能夠幫助GPU更快速的導出熱量,從而使整個顯卡清涼又靜音。
  • 耕升RTX 2080 super G魂OC評測:這麼拉風的顯卡你確定不來一塊?
    今天我們帶來的就是G魂系列的新成員,耕升RTX 2080 super G魂OC。  話不多少,這就給各位看官奉上詳細評測。super G魂OCNVIDIA RTX 2080 Super公版架構TuringTuring核心型號TU104-450
  • 雙倍的性能,雙倍的快樂:英偉達RTX 30系顯卡架構解析
    英偉達在北京時間9月2日舉辦新品發布會,正式發布了全新的英偉達RTX 30系顯卡,包括RTX 3070、RTX 3080以及RTX 3090,採用了最新的安培架構以及高度定製的三星的8nm製程工藝,在性能上也取得了極大的提升,可以說幾乎橫掃了所有的20系顯卡。
  • NVIDIA發布GeForce RTX平臺遊戲顯卡,全新Turing架構性能提升6倍
    8月20日Gamescom2018展會前夕,NVIDIA發布首款基於NVIDIA Turing架構和NVIDIA RTX平臺的遊戲顯卡——NVIDIA GeForce RTX 2080 Ti/2080/2070,全新NVIDIA遊戲顯卡加入可編程著色、實時光線追蹤以及人工智慧等功能。
  • NVIDIA RTX 3060 Ti現身《奇點灰燼》基準測試資料庫
    RTX 3060 Ti這款顯卡還沒有得到NVIDIA官方確認,但是已經出現在《奇點灰燼》基準測試資料庫當中,測試顯示了它與RTX 3070性能對比,測試結果顯示這款中端產品的性能比大部分基於圖靈架構的NVIDIA顯卡都要好。
  • RX 5700上水冷,解鎖功耗超頻2.2GHz,直逼RTX 2080 FE
    AMD Radeon RX 5700 XT 超頻至2.2GHz,性能直追GeForce RTX 2080 FE。測試平臺配置明細在遊戲《古墓麗影:暗影》的基準測試中,超頻後的 RX 5700XT 平均幀數基本持平 RTX 2080 FE ,反超了同樣超頻的 RTX 2070S,下圖就詳細的列出了幾款顯卡在不同頻率設定的幀數表現,其中
  • 圖靈RTX顯卡比Pascal顯卡在某些表現強40% 超頻能力是亮點
    他談到了圖靈架構的張量核和RT核,更多地解釋了深度學習超級採樣技術,或許最重要的是,他承認英偉達「本可以做得更好」,突出了新gpu的性能。他還坦率地談到了GTX 2080卡能夠帶來什麼樣的性能提升。英偉達的新聞發布會大部分時間都在討論光線追蹤技術,以及基於圖靈的顯卡帶來的性能提升。