喜歡日本動漫和賽車的讀者一定看過早期風靡螢屏的動畫連續劇——頭文字D。在求學之餘幫父親送豆腐的藤原拓海有著非常出色的漂移技巧,因此在秋名山迎來許多對手的挑戰。雖然在與京一的比賽中發動機爆缸,但經過父親藤原文太的精心改裝,一輛擁有澎湃核心的豐田AE86由此誕生......
AE86是豐田製造的一款小巧、輕量、經濟型的汽車,在頭文字D動畫片推出之前,這款汽車很少有人關注。但該片一經播出,AE86便成為漫迷們茶餘飯後的話題。動畫片中AE86的核心部件(發動機)經藤原文太更換後,外形還是AE86,但不起眼的車身裡面,卻隱藏著恐怖的動力。
相信許多汽車迷們在看完頭文字D動畫片後,都夢想擁有一輛如AE86般的座駕。而在DIY界,遊戲玩家們同樣期待類似的顯卡出現:沒有高端的定位,甚至沒有華麗的外表,但散熱器下面卻壓著一顆強勁的核心。今天,這樣的產品終於出現在我們面前——採用Tahiti架構設計的Radeon HD7870。
Tahiti架構Radeon HD7870
雖然AMD在媒體溝通會上一再強調,至少到第三季度,AMD不會推出任何Radeon HD8000系列產品,但從近期的動向上看,Radeon HD7000似乎內藏玄機。前期,海外已經發布了針對中低端市場的Radeon HD7000系列新品HD7790,雖然該產品已經確定不會在中國大陸上市,但在「愚人節」即將來臨之際,中關村在線顯卡頻道還是收到了令大家為之一震的新品。下面,就讓我們與讀者一起揭開Tahiti架構Radeon HD7870的神秘面紗。
》現在去顯卡道轉轉《 | 》看看今日最新文章《
》顯卡精彩美圖匯總《
★ Tahiti架構Radeon HD7870規格及特色一覽
AMD之前發布的Radeon HD7870均基於Pitcairn架構設計,而本次測試的Radeon HD7870則基於Tahiti架構設計(我們姑且稱之為Radeon HD7870T),而旗艦級Radeon HD7970和次旗艦Radeon HD7950使用的正是該架構。因此從另一方面說,Radeon HD7870T理論上應該擁有Tahiti架構的全部特性。
顯 卡 對 位 產 品 規 格 比 較 表顯卡型號迪蘭Radeon HD7870T擁有1536個Shader單元,比Radeon HD7870多一組,比Radeon HD7950少一組,比Radeon HD7970少兩組。後端方面,Radeon HD7870T的ROP陣列規模與旗艦級Radeon HD7970相同,均為32個;紋理單元Radeon HD7870多一組,比Radeon HD7950少一組,比Radeon HD7970少兩組,而顯存部分仍然由4個64bit MC進行管理,構成256bit顯存位寬,與Radeon HD7870相同。
Tahiti架構Radeon HD7870圖形核心
其他方面,Radeon HD7870T的默認核心/顯存頻率為925/6000MHz(Radeon HD7870為1000/4800MHz),支持AMD PowerTune自動超頻技術,核心頻率可動態提升至975MHz。顯存容量為2048MB,顯存帶寬升至192.0GB/s(Radeon HD7870為153.6GB/s),同樣支持DirectX 11.1、Open CL 1.2、以及C++ AMP。從規格不難看出,Radeon HD7870T的定位處於Radeon HD7870和Radeon HD7950之間。
Tahiti架構特性
★ Tahiti架構Radeon HD7870特色由六個主要部分組成:
● 基於HKMG的TSMC全新28nm製程工藝;
● 包含了幾何引擎、光柵化引擎以及一級線程管理機制的前端ACE(Asynchronous Compute Engine);
● 負責處理運算任務及Pixel Shader的32個CU(Compute Unit)集群,包含在CU內部負責處理材質以及特種運算任務如卷積、快速傅立葉變換等的Texture Array,二級線程管理機制以及它們對應的Shader + Unified Cache等緩衝體系;
● 負責完成Fillrate過程以及輸出最終畫面的ROP陣列,顯存控制器MC(Memory Controller)以及PCI Express 3.0部線傳輸控制端;
● 全新抗鋸齒——MLAA 2.0和SSAA For DirectX Based Games;
● 負責視頻回放及處理的UVD 3.0單元,以及全新的負責視頻編碼部分的VCE;
● Eyefinity(寬域)2.0引擎。
● 異步運算引擎
ACE全稱Asynchronous Compute Engine,譯為異步計算引擎。作為AMD GPU最前端的組成部分,它的實際作用其實與幾何以及光柵化等圖形過程並沒有直接的聯繫。ACE位於整個GPU的最前端管理任務隊列,它會將線程塊規整的分發給後面的ALU團簇。ACE是所有GPU任務的起點,它的存在和表現直接關係到了GPU進行圖形及通用計算任務是的效率表現。
由於ACE與幾何引擎直接相連,同時也在一定程度上決定了構架的多邊形搏出能力,因此我們可以籠統的把它理解成前端/幾何引擎與線程管理機制的結合體。Tahiti中的Dual ACE不僅改變了RV870構架幾何性能較弱的局面,更為AMD向並行處理構架的進化打開了大門。
Tahiti架構Dual ACE細節
Daul ACE首次出現於Cayman構架,區別於傳統的AMD構架,Cayman擁有了第二套完整的光柵化-幾何處理單元陣列,該陣列擁有Rasterizer、Hierarchical-Z以及Tessellator/Germetry等全部的前端資源體系,與原有的前端部分完全對等,並且與流水線中的線程仲裁器UTDP直接對應。
Cayman架構的Dual ACE
Dual ACE的價值是顯而易見的,它讓Cayman擁有了雙倍於RV870的幾何處理能力,這極大地改善了RV870在面對曲面細分等領域時的表現。同時,由於單位周期的三角形搏出能力也從1個提升到了2個,Dual ACE的出現讓Crysis這樣對於傳統多變形輸出能力有很大需求的遊戲也能獲益。最後,更快的光柵化處理能力帶來了更快的坐標變換和像素化速度,這降低了後續流水線步驟的等待延遲,從而為最低幀表現的提升提供了幫助。
Tahiti大幅提升的曲面細分性能
Cayman中Dual ACE的表現,讓AMD看到了提升體系線程管理能力以及宏觀並行度的好處,因此在Tahiti構架中,AMD對ACE進行了進一步的強化。根據AMD公布的數據,Tahiti構架擁有了4倍於Cayman的曲面細分能力,同時通用計算性能也有了長足的進步,這從側面表明Tahiti構架的線程能力較之Cayman有了更進一步的提升。
● ALU團簇:Compute Unit
Tahiti構架最大的改進來自ALU集群部分。與傳統AMD構架的VLIW結構ALU團簇不同,Tahiti構架的ALU集群撤消了來自超長字節指令的限定,所有ALU全部以SIMD的形式來完成吞吐,不再需要打包和解包的過程。
在Tahiti構架中,ALU團簇的名稱從VLIW SIMD變成了Compute Unit,名稱的改變不僅標誌著功能及用途的變遷,更暗示了內部結構的方向性變化。Tahiti擁有32個CU單元,CU內部包含4組SIMD CORE,每組SIMD CORE由16個標準Vector ALU構成,所以Tahiti的一個CU單元擁有64個Vector ALU,32個CU單元合計擁有2048個Vector ALU。
Tahiti架構CU結構細節
除了負責浮點吞吐的SIMD CORE之外,Tahiti構架的每個CU單元還擁有在一個Scalar Unit,Scalar單元中包含Int ALU單元,可以用來處理整數指令以及特殊函數。另外,對線程效率至關重要的原子操作(Atomic)也在該單元中執行。
運算單元之外,Tahiti構架的每個CU還綁定了由Branch和Scheduler構成的二級線程控制機制,以及一個完整的Texture Array,Texture Arroy的作用與傳統AMD構架中的TMU基本相同,包含了完整的Texture Fetch Load/Store Unit以及Texture Filter Unit。
Intel Larrabee構架
由此不難看出,Tahiti構架CU單元的結構在邏輯層面上已經與Fermi構架的SM單元和Larrabee的Vector Unit存在極大的相似性。三者均由浮點吞吐部分(Tahiti的Vector ALU團簇,Fermi的SP單元集群,Larrabee的Vector集群),整數、特殊函數及原子操作部分(Tahiti的Scalar Unit,Fermi的SFU,Larrabee的Scalar pipeline)以及二級線程控制機制(三方的Scheduler等)。除此之外,CU還與Fermi的SM一樣擁有完整的Texture Arroy,甚至每一個運算單元(Tahiti的Vector ALU,NVIDIA的SP單元)都擁有完全相同的4K寄存器。
CU進行wavefront吞吐示意
一個CU/SM/Vector Unit就是一個獨立的處理單元,能夠面對一個標準的指令集群或者說線程塊,也就是AMD的wavefront以及NVIDIA的warp。Tahiti的CU能夠在一個周期內處理一個64線程的wavefront,這與Fermi一個周期處理一個32線程的warp是相同的,但AMD目前上不存在類似half warp的線程塊子劃分機制。
Tahiti支持WinZip最新版帶來的Open CL加速
更新之後的CU單元在計算能力和效率方面有了長足的進步,不僅令Compute Shader處理能力大幅提升,進而提升了GPU在DirectX 11環境下的圖形性能,而且在通用計算領域也獲得了更加廣闊的前景和更多樣化的發展可能。
● 統一緩衝體系
Tahiti另一個巨大的改進,來自緩衝體系的大幅調整。Tahiti構架的緩衝體系不僅對原有的GDS以及LDS等Shared資源進行了調整和重新布置,更引入了非常重要的多級unified cache。
不同於傳統的被所有VLIW CORE共享使用的整體GDS,Tahiti構架的每個CU擁有獨立的32K GDS(Golbal Data Share),這個尺寸完全符合微軟在DirectX 11中的硬性規定。其中可以劃分出16K作為L1 Data cache,Tahiti構架的多級cache體系屬於包含式結構,L2保存了全部的L1數據且能夠允許L1數據進行回寫,結合AMD的官方描述,我們認為在宏觀範圍內Tahiti的Shared存在32K GDS+0K L1 Data cache+16K L2 Data cache或者16K GDS+16K L1 Data cache兩種組合方式。
Tahiti架構緩衝體系
除了GDS+L1共享構成的以及緩衝體系,Tahiti構架的每個CU還擁有獨享的LDS(Local Data Share),LDS在RV770以後的AMD構架中均有出現並為所有VLIW CORE共享,而此次在Tahiti中,LDS與GDS一樣被打散到了每一個CU中,變成了專享的二級補充Shared。
除了一級緩衝和Shared,Tahiti的CU單元還擁有共享的L1 Instruction cache和Kernel cache,每4個CU共享16K的L1 Instruction cache和32K的Kernel cache。
Tahiti構架緩衝體系細節(引自後藤弘茂blog)
最後,Tahiti構架擁有溝通上級緩衝與顯存的L2 Data cache,L2 cache與MC一一對應,因此Tahiti共擁有6組合計768K的L2 cache。L2 cache面向所有CU中的單元開放,ALU可以用它緩衝數據,TMU也可以用它充當Texture cache。
Fermi構架緩衝與單元的關係
整體來說,Tahiti的緩衝體系與Fermi存在極大的相似度,無論是可共享/切換的一級Shared/L1機制,還是面向所有單元並可以同時充當Texture cache的L2,Tahiti與Fermi在緩衝體上都已經處在了一致的狀態。兩者最大的區別,在於Tahiti採用了指令和數據緩存分離的方式,同時在L1與Shared的切換方式及尺寸上與Fermi存在差異。相對來說,Tahiti的切換及分配方式更加靈活多樣,但同時也對cache的操作切換控制提出了更高的要求。
● 全新的PRT技術
Tahiti構架全面引入了一種新的超大尺寸材質處理技術,這便是全新出現的PRT(Partially Resident Textures)。
PRT技術細節
PRT技術類似之前在ID Tech5中出現過的MegaTexture技術,他們都是將整塊大尺寸材質分割成小塊,然後按照材質的使用概率對其進行不同位置的存放。在預處理mipmaps的過程中,GPU會根據mipmaps的狀況來對材質整體使用情況進行預測和判斷,並從材質庫中直接進行抓取。如果這個抓取動作快速拾取的材質「命中」的通過mipmaps進行的判斷,則Texture會直接進行快速貼圖操作。
ID Tech5採用的Mega Texture技術
如果被拾取的材質並未「命中」,整個GPU體系將會對接下來進行的工作進行預測並維持整個流水線的動作,貼圖需求將以常規的形式被Texture Array加以滿足。直到下一幀畫面再次出現通過mipmaps進行判斷的時候為止。
PRT技術實現的效果
PRT技術可以藉由上述這個帶有分支預測性質的動作過程大幅加快材質操作的速度,讓體系具備實現32TB級別大小的材質操作的能力,同時還可以大幅降低Texture Array對材質進行操作時產生的延遲激增以及「塞車」現象。
● 全新的MLAA 2.0以及SSAA抗鋸齒特性
我們知道與Radeon HD7850/HD7870一同發布的還有AMD全新的抗鋸齒特性——MLAA 2.0和SSAA For DirectX Based Games,該特性在Tahiti架構Radeon HD7870中同樣被很好地繼承下來。
基於全新邊緣形態算法的MLAA 2.0
MLAA是AMD開發的基於通用計算完成的抗鋸齒模式,該模式允許ALU以通用計算的形式對物體邊緣多邊形進行顏色混合處理,已達到邊緣柔化和抗鋸齒的目的,NVIDIA的FXAA在功能上與之類似。全新的MLAA2.0帶來了更加高級的邊緣形態算法,能夠允許顯卡完成更加銳利的抗鋸齒輸出表現。該項功能將於新版本催化劑中獲得實現。
基於稀疏網格的SSAA
與MSAA相比,SSAA(SuperSample Anti-Aliasing,超級採樣抗鋸齒)能過獲得更加優秀的抗鋸齒效果,但性能損耗也更為巨大。SSAA for DirectX Based Games允許支持DirectX 9及以上的大多數遊戲在AMD顯卡環境下以稀疏網格(Sparse Grid)的方式來實現SSAA過程,在保證畫面質量的同時將SSAA的性能損耗降到了可以接受的範圍內。
● 無損各向異性過濾及DirectX 11.1支持
在Cayman發布時,AMD曾宣稱自己的各向異性過濾算法是世界上最好的算法,不僅性能近乎無損而且可視角度方面的表現也完美無缺。但事後有大量媒體證明,Cayman的AF實際上在部分場合會導致LOD錯誤、閃爍等問題,AMD於Cayman發布後也承認了該方面的問題。
新各向異性過濾細節
在此次的HD7970中,AMD引入了一種全新的非角度依賴算法,在解決Cayman紋理閃爍問題的同時提供了更好的AF性能表現。
全新的非角度依賴算法
通過新算法的引入,HD7970中的AF重寫了整個內核,AMD為其引入了全新的自動調用機制,並承諾不會再出現紋理閃爍以及波浪狀扭曲等錯誤,同時還承諾了新的AF算法將真正實現全角度有效。
DirectX 11.1技術細節之TBDR
除此之外,Tahiti構架的另一個重要特性在於DirectX 11.1的支持,DirectX 11.1中包含了DP Shader等諸多對未來圖形化過程有深遠影響的更新,可以說是一個具有開端意義的API升級。HD7970對DirectX 11.1特性提供了全面的支持,用戶可以在未來快速的進入全新API的應用環境,獲得全新的圖形體驗。
● VCE視頻編碼處理引擎
VCE技術是AMD在Tahiti構架中引入的另一個重要改進,相較於UVD3.0的原地踏步,VCE技術的出現可以說是Tahiti構架在視頻相關方面最引人注目的亮點。
VCE功能細節
VCE技術從本質上來說是一組專門負責編碼操作的硬體電路,該單元在操作方式上類似Intel Quick Sync Video高速視頻編碼處理電路,都是通過固定單元來高速完成視頻編碼過程的Preprossing以及Encode過程,這也是整個視屏編碼過程中最為消耗系統運算能力的部分。以專門的電路來完成類似的操作不僅能夠提升處理速度,同時還可以大幅降低處理過程所帶來的功耗壓力。
VCE單元Full模式
VCE與Quick Sync Video最大的不同,同時也是VCE意義最重大的設計,來自它的異構式處理結構。VCE對視頻編碼的操作分為兩種模式,在Full Mode下,VCE會以自身的硬體單元來完成Preprossing以及Encode的全部過程。而Hybird Mode下,VCE單元會調用Tahiti構架豐富的ALU資源來更高速的完成Preprossing過程,以VCE自身的硬體單元來完成Encode過程。在性能最理想的狀態下,VCE可以實現1080P解析度視頻的60幀速率實時編碼。
VCE單元Hybird模式
VCE技術的意義是巨大的,除了在GPU單元中第一次引入了低功耗的專用高速視頻編碼處理電路之外,VCE體現了AMD多年來一直強調並不斷付諸實施的異構計算操作結構。Fusion的精髓便是異構處理和加速,這種整體思路正在逐步融入AMD的每一個產品線甚至每一個適合的產品中。VCE技術的出現,不僅進一步實踐了異構處理的想法,更向我們表達了AMD正在逐漸恢復的堅定的執行力。
● Eyefinity(寬域)2.0技術
民用低成本多屏拼接的Eyefinity技術一直是AMD的長處。在HD7970中,AMD將Eyefinity技術升級到了2.0版本,新的Eyefinity寬域技術為我們帶來了更多富有特色的輸出方案和視覺體驗。
Eyefinity技術不斷沿革
在Eyefinity 2.0技術中,AMD首次將多屏輸出技術和HD3D立體技術結合在了一起,HD7970的用戶僅需使用一塊顯卡便可以在多屏系統上同時體驗立體遊戲和電影。NVIDIA在SLI系統中雖然早就實現了3D Vision,但始終需要至少兩塊顯卡才能完成輸出工作。
Eyefinity 2.0的全新改進
新的Eyefinity 2.0率先採用了DisplayPort 1.2認證接口和HDMI 1.4a規範,在傳輸帶寬和速度上能夠通過更高的速度,為多屏3D應用提供更好的條件。AMD提供的HD3D技術是開放的,這讓更多的廠商能夠參與到AMD的HD3D立體顯示技術當中,AMD單卡通過DisplayPort 3D顯示器可以單卡實現三屏Stereo 3D效果。
AMD多屏允許不同尺寸顯示器
Eyefinity2.0最重大的更新來自解析度的多樣化及組建屏幕要求的降低,Eyefinity1.0至少需要3臺解析度一致的顯示器才能組建多屏輸出,這要求很多用戶採購新顯示器,組建成本並不低。而在Eyefinity2.0中,AMD允許不同尺寸顯示器組成一套Eyefinity多屏顯示系統,這進一步降低了多屏輸出的成本。但受限於現在的遊戲輸出技術,Eyefinity2.0在多個不同尺寸顯示器組合的方案中還存在部分場景及物體顯示不全等問題,相信隨著技術的不斷進步,這些問題終將得到解決。
全新的獨立多路音頻輸出
音頻輸出能力的改進也是Eyefinity2.0的革新之一,HD7970支持獨立數字多點音頻(Discrete Digital Multi-Point Audio),簡稱DDM Audio。Eyefinity1.0隻能輸出一路音頻信號,而HD7970顯卡已經可以實現獨立多路音頻輸出了,這樣多屏看電影或者玩遊戲時,每個屏幕都可以進行獨立的音畫輸出。
● Tahiti架構首款Radeon HD7870拆解介紹
首款到達中關村在線顯卡頻道的Radeon HD7870T顯卡為迪蘭HD7870 酷能+2G Extreme。該顯卡與Pitcairn架構Radeon HD7870究竟有哪些不同之處,接下來就開始我們的拆解介紹:
迪蘭HD7870 酷能+2G Extreme採用28nm製程工藝,GCN架構設計的Tahiti圖形核心,核心面積365 mm2。該顯卡擁有1536個流處理器,32個ROPs單元和96個紋理單元,完美支持DirectX 11.1遊戲特效、CrossFire雙卡交火等技術。
迪蘭HD7850酷能+ 2G Extreme
迪蘭HD7850酷能+ 2G Extreme非公版PCB正面
迪蘭HD7850酷能+ 2G Extreme非公版PCB背面
迪蘭HD7870 酷能+2G Extreme採用非公版PCB設計,供電部分採用核心與顯存獨立的4+2相數字式PWM供電方案,元器件採用全固態電容與亞鐵鹽芯電感,輔以雙6pin外接供電接口,為顯卡的穩定運行提供了充足的保障。
圖形核心 供電方案
顯存顆粒 外接供電
迪蘭HD7870 酷能+2G Extreme搭載海力士GDDR5高速顯存顆粒,顯存容量2048MB,顯存位寬256bit,顯存帶寬192.0GB/s,顯卡的默認核心/顯存頻率為925/6000MHz,且支持AMD PowerTune自動超頻技術,核心頻率可動態提升至975MHz。
迪蘭PCS+散熱器
迪蘭PCS+散熱器背面
散熱風扇 散熱底座
散熱鰭片 銅質熱管
迪蘭HD7870 酷能+2G Extreme搭載自主研發設計的PCS+散熱系統。92毫米PWM自能溫控風扇可以根據顯卡運行狀態自主調節轉速,在散熱效能和噪音控制方面取得了良好的平衡;一根8mm S形熱管加兩根6mm S+U形熱管全面覆蓋並直接接觸圖形核心,有效增加了散熱器的散熱效率。
視頻輸出接口
迪蘭HD7870 酷能+2G Extreme採用DVI-D+HDMI+雙Mini DisplayPort輸出組合,支持市面上絕大多數顯示器的接口需要。同時該顯卡支持單卡多屏輸出技術,滿足了不同用戶對顯卡的不同使用需要。
● 測試平臺硬體環境一覽
為保證測試能夠發揮顯卡的最佳性能,本次Radeon HD7870T首發測試平臺由Intel酷睿i7-3970X處理器、技嘉X79晶片組主板、芝奇4GB DDR3-1600×4四通道內存組建而成。詳細硬體規格如下表所示:
測 試 平 臺 硬 件 環 境
中 央 處 理 器
Intel Core i7-3970X
(6核/12線程/3.5GHz/15MB L3)
散 熱 器
Intel RTS2011LC
(原廠水冷散熱器 / 選配件)
內 存 模 組
G.SKILL RipjawsX DDR3-1600 16GB
(SPD:11-11-11-28-1T)
主 板
GIGABYTE GA-X79-UD7
(Intel X79 Chipset)
硬 盤
Seagate Barracuda 1TB
(1TB/7200RPM/32MB緩存/SATA3)
電 源
NERMAX 白金冰核 1500W
(CSCI Platinum 80Plus/ 1500W)
顯 示 器
DELL UltraSharp 3008WFP
(30英寸LCD / 2560×1600解析度)
● 測試平臺軟體環境一覽
為保證系統平臺具有最佳穩定性,本次產品測試所使用的作業系統為Microsoft Windows 7正版授權產品,除關閉自動休眠外,其餘設置均保持默認,詳細軟體環境如下表所示。
操 作 系 統 及 驅 動
作業系統
Windows 7 Ultimate RTM SP1
(64bit / 版本號7601)
主板晶片組驅動
Intel Chipset Device Software
(WHQL / 版本號 9.2.3.1022)
AMD顯卡驅動
AMD Catalyst
(Beta / 版本號 13.3 Beta3)
NVIDIA顯卡驅動
NVIDIA GeForce GTX
(Beta / 版本號 314.21)
桌面環境
Windows 7 Ultimate RTM SP1
2560×1600_32bit 60Hz
在測試成績方面,理論性能測試用得分來衡量性能,數值越高越好;遊戲性能測試用Fraps記錄平均幀數來衡量性能,數值同樣越高越好。
特別說明:為保證測試過程中AMD/NVIDIA驅動程序特效設置完全相同,公平起見,我們調整了AMD催化劑驅動的AI控制功能,將鑲嵌等級從驅動默認的「AMD優化」改回「應用程式控制」。在這樣的設置下,AMD顯卡才會在遊戲中使用正確的遊戲自身設置的曲面細分等級,而不是AMD預設的更低的曲面細分等級。
● 理論性能測試:3DMark FireStrike
於北京時間2013年2月5日推出的新3DMark,採用全新界面設計,除了測試分數,還會展現每個場景測試期間的實時曲線,全程記錄幀率、CPU溫度、GPU溫度、CPU功耗。新3DMark取消了傳統的E、P、X模式,取而代之的是根據負載不同所推出的三個場景,其中FireStrike專為基於DirectX 11顯卡搭建的高端遊戲平臺,而CloudGate則支持基於DirectX 10環境的主流硬體,IceStorm則支持入門級DirectX 9設備、手機、平板電腦等等。
3DMark FireStrike
Radeon HD7870T測試成績
Radeon HD7870T測試成績
通過3DMark FireStrike理論性能測試可以看出,在Performance模式下,Radeon HD7870T測試成績與Radeon HD7950基本相同;而在Extreme模式下,雖然測試成績基本相同,但Radeon HD7870T卻小幅領先於Radeon HD7950。
● 理論性能測試:3DMark 11
PC遊戲隨Windows 7的發布進入DirectX 11時代,眾多DirectX 11顯卡早已摩拳擦掌上陣廝殺,卻遲遲沒有一個權威性的基準測試軟體來衡量遊戲顯卡DirectX 11性能的高低。終於,DirectX 11時代的3DMark 11來到大家面前。3DMark 11使用原生DirectX 11引擎,測試場景包括Tessellation曲面細分、Compute Shader以及多線程在內的大量DirectX 11特性。
3DMark 11
Radeon HD7870T測試成績
Radeon HD7870T測試成績
通過3DMark 11理論性能測試可以看出,在Performance模式下,Radeon HD7870T成績超越Radeon HD7950,領先幅度約為4.7%;在Extreme模式下,Radeon HD7870T與Radeon HD7950成績基本相同,並以26分的優勢小幅領先。
● DirectX 11性能測試:Heaven Benchmark 3.0
Heaven Benchmark 3.0是由俄羅斯Unigine遊戲公司開發設計的一款Benchmark程序,該軟體採用類似阿凡達的懸浮島場景,其中龍雕塑運用了細分曲面技術,還有島上的路徑和房子的磚塊。Heaven Benchmark 3.0支持DirectX 9、DirectX 10、DirectX 11與OpenGL 3.2 API,通過23個場景測試最終得出顯卡的實際效能。
Heaven Benchmark 3.0
Radeon HD7870T測試成績
通過Heaven Benchmark 3.0理論性能測試可以看出,Radeon HD7870T成績再次超越Radeon HD7950,領先幅度約為1.4%;同時,與Pitcairn核心Radeon HD7870性能差距更為明顯,領先幅度約為7.7%。
● DirectX 11性能測試:Heaven Benchmark 4.0
Heaven Benchmark 4.0是一款專門測試DirectX 11效率的軟體,由俄羅斯Unigine遊戲公司自主研發的引擎設計。該軟體擁有類似阿凡達的懸浮島場景,其中龍雕塑運用了細分曲面技術,抱括島上的路徑和房子的磚塊等23個場景的測試得出顯卡的最終實際效能,並通過DirectX 11環境帶來很強的真實感。
Heaven Benchmark 4.0
Radeon HD7870T測試成績
通過Heaven Benchmark 4.0理論性能測試可以看出,Radeon HD7870T成績同樣領先Radeon HD7950,領先幅度約為4%;且與Pitcairn核心Radeon HD7870差距更為明顯,領先幅度約為7.1%。
● DirectX 11遊戲測試:《孤島危機3》
《孤島危機3》是《孤島危機》的最新續作,遊戲採CryENGINE 3引擎所製作,其卓越的畫面表現以及精彩的劇情相信已無需多言。作為硬體殺手的第三代,只支持DirectX 11的Crysis3 PC版再次將遊戲的畫面精美程度和硬體需求提升到了新的高度。
《孤島危機3》
Radeon HD7870T測試成績
Radeon HD7870T測試成績
通過DirectX 11遊戲《孤島危機3》測試可以看出,在2560×1600解析度下,Radeon HD7870T成績與Radeon HD7950基本相同,並且領先於Pitcairn核心Radeon HD7870,領先幅度約為9.4%;在1920×1200解析度下,Radeon HD7870T成績同樣與Radeon HD7950基本相同,領先Pitcairn核心Radeon HD7870幅度高達11.1%。
● DirectX 11遊戲測試:《孤島危機2》
《孤島危機2》是《孤島危機》的續作,遊戲採用CryENGINE 3引擎製作。《孤島危機2》在遊戲內容上與一代也有很大變化,已經從秘密的叢林作戰轉向了公開、大規模的現代城市戰爭。故事發生在距一代3年後的2023年,外星人在地球上的大片區域挑起了戰爭,各大城市都遭到攻擊,人口銳減,玩家將要進行捍衛地球的末日戰爭。
《孤島危機2》
Radeon HD7870T測試成績
Radeon HD7870T測試成績
通過DirectX 11遊戲《孤島危機2》測試可以看出,在2560×1600解析度下,Radeon HD7870T的平均幀數與Radeon HD7950基本相同,領先Pitcairn核心Radeon HD7870的幅度約為7.1%;在1920×1200解析度下,Radeon HD7870T平均幀數略微落後於Radeon HD7950,同時與Pitcairn核心Radeon HD7870的性能差距約為7.6%。
● DirectX 11遊戲測試:《古墓麗影9》
《古墓麗影9》將講述蘿拉的首次冒險之旅,主角蘿拉·克勞馥的年齡被設定在21歲,那時的她還只是一名剛出茅廬的新人,經驗欠缺。隨著遊戲劇情的發展,玩家將與蘿拉共同成長,獲得新的武器和道具並習得新技能。在冒險的小島上,玩家可以在營地對道具進行組合,有些特定區域就需要特定道具和技能才能通過。島上的各個營地之間可以快捷傳送,玩家無需長途跋涉。而除了蘿拉外還將有其他角色出現在島上。
《古墓麗影9》
Radeon HD7870T測試成績
Radeon HD7870T測試成績
通過DirectX 11遊戲《古墓麗影9》測試可以看出,在2560×1600解析度下,Radeon HD7870T在成績上領先Radeon HD7950,領先幅度約為4.1%;在1920×1200解析度下,Radeon HD7870T的平均幀數與Radeon HD7950基本相同,並且略微領先。
● DirectX 11遊戲測試:《殺手5:赦免》
《殺手5:赦免》採用IO Interactive自主研發的冰川2(Glacier 2)引擎製作,遊戲內容都是在引擎下實時進行反饋的,所有動作都是即時生成的。新作主要場景發生在芝加哥,名為代號47的主角在本作中將更加靈活,更好控制。他將可以攀在懸崖邊,還可以保持平衡,遊戲融入了掩護系統,挾持人持的功能回歸。
《殺手5:赦免》
Radeon HD7870T測試成績
Radeon HD7870T測試成績
通過DirectX 11遊戲《殺手5:赦免》測試可以看出,在2560×1600解析度下,Radeon HD7870T成績落後於Radeon HD7950;在1920×1200解析度下,Radeon HD7870T的平均幀數同樣落後於Radeon HD7950,但領先Pitcairn架構Radeon HD7870的幅度卻高達12.4%。
● DirectX 11遊戲測試:《失落星球2》
《失落星球2》採用CAPCOM公司原創引擎MT Framework的最新版VER 2.0進行開發。相比上一代,遊戲世界的表現將更加細緻和美麗。變化不僅僅是畫面上的,《失落星球2》將會在前作玩家要求基礎上追加大量全新要素,新場景、新角色、新武器自然不必多說,角色的動作也比前作更加豐富多彩。
《失落星球2》
Radeon HD7870T測試成績
Radeon HD7870T測試成績
通過DirectX 11遊戲《塵埃3》測試可以看出,無論2560×1600解析度,還是1920×1200解析度,Radeon HD7870T的平均幀數均與Radeon HD7950基本相同,且Radeon HD7870T在兩種解析度下均領先於Pitcairn架構的Radeon HD7870。
● DirectX 11遊戲測試:《塵埃3》
《塵埃3》是由Codemasters製作發行的一款賽車競速單機遊戲,《塵埃3》採用與《F1 2010》同樣的Ego引擎,擁有更加擬真的天氣系統及畫面效果。遊戲將包含冰雪場景、動態天氣、經典的賽車、分屏對戰、party模式、開放世界、更多真實世界中的贊助商和車手等特點。
《塵埃3》
Radeon HD7870T測試成績
Radeon HD7870T測試成績
通過DirectX 11遊戲《塵埃3》測試可以看出,與《失落星球2》相同的,Radeon HD7870T無論在2560×1600解析度,還是1920×1200解析度下平均幀數均與Radeon HD7950基本相同,並且略微領先,Pitcairn架構Radeon HD7870已經被徹底打敗。
● DirectX 11遊戲測試:《地鐵2033》
《地鐵2033》由烏克蘭4A遊戲工作室開發,採用4A遊戲引擎,PC版支持NVIDIA PhysX物理特效。2013年,由於大面積的核戰,導致幾乎所有的人類都被消滅,而且地面已經被汙染無法生存,極少數倖存者存活在莫斯科的深度地下避難所,人類文明進入新的黑暗時代。直至2033年,整整一代人出生並在地下成長,他們長期被困在「地鐵站」的城市。
《地鐵2033》
Radeon HD7870T測試成績
Radeon HD7870T測試成績
在DirectX 11遊戲《地鐵2033》測試中,在2560×1600解析度下,Radeon HD7950以不到1幀的平均幀數稍微領先Radeon HD7870T;而在1920×1200解析度下,Radeon HD7950在平均幀數上卻與Radeon HD7870T相差無幾。
● DirectX 11遊戲測試:《蝙蝠俠:阿克漢姆之城》
蝙蝠俠:阿克漢姆之城之城(Batman: Arkham City)是2009年最佳動作遊戲《蝙蝠俠:阿甘瘋人院》的續作,由華納兄弟出品,該作由Rocksteady工作室負責開發,世界架構仍然建立在《阿克漢姆瘋人院》的氣氛上,不過這次上升至阿克漢姆之城——高譚市內戒備森嚴的,關押了大量暴徒的監獄之中。新作匯集了眾多明星參與的配音陣容以及蝙蝠俠中的極度兇殘的惡棍,並改進和加強了一遊戲特點,讓玩家們擁有像《蝙蝠俠:黑暗騎士》一般的終極遊戲體驗。
《蝙蝠俠:阿克漢姆之城》
Radeon HD7870T測試成績
Radeon HD7870T測試成績
Radeon HD7870T在DirectX 11遊戲《蝙蝠俠:阿甘之城》中的表現並不出彩,通過該項測試可以看出,Radeon HD7950無論在2560×1600解析度還是1920×1200解析度下均領先Radeon HD7870T,領先幅度分別為4.7%和5.5%。
● DirectX 11遊戲測試:《無主之地2》
《無主之地2》為一款RPG風格合作FPS遊戲,作為《無主之地》的續作,這款卡通渲染風格的二代遊戲可以讓玩家仍然扮演來自前作的自定義英雄,同時引入了名為「聖安德列斯風格」的升級系統。並且該作取消在線多人模式,支持合作模式。
《無主之地2》
Radeon HD7870T測試成績
Radeon HD7870T測試成績
而在DirectX 11遊戲《無主之地2》測試中,Radeon HD7870T優勢盡顯,無論在2560×1600解析度還是1920×1200解析度下均領先於Radeon HD7970,領先幅度分別為6.2%和5.9%,而Pitcairn架構Radeon HD7870已經被徹底甩在後面,性能差距過於明顯。
通過前面的測試可以看出,採用Tahiti架構設計的Radeon HD7870在性能上有著非常明顯的優勢,大部分測試中的平均幀數均領先於同架構的次旗艦產品Radeon HD7950,而Pitcairn架構Radeon HD7870在性能上已毫無任何優勢可言。那麼Tahiti架構Radeon HD7870在溫度和功耗方面的表現又如何呢,下面我們就一起來看下。
● Tahiti架構Radeon HD7870溫度測試
Radeon HD7870T待機溫度
Radeon HD7870T滿載溫度
通過溫度測試可以看出,Radeon HD7870T的待機溫度與Pitcairn核心Radeon HD7870基本相同,而滿載溫度卻比Pitcairn核心Radeon HD7870低3℃,這與非公版熱管散熱器更好的散熱效能不無關係。
● Tahiti架構Radeon HD7870功耗測試
Radeon HD7870T待機功耗
Radeon HD7870T滿載功耗
Tahiti架構的功耗劣勢再次顯現出來,通過功耗測試可以看出,採用Tahiti架構設計的Radeon HD7870無論待機功耗還是滿載功耗均要高出Pitcairn架構Radeon HD7870不少,看來用戶要在性能和功耗兩個方面進行取捨了。
● Tahiti架構Radeon HD7870超頻測試
通過一番調整,我們使用Catalyst驅動自帶的超頻工具成功將迪蘭HD7870酷能+ 2G Extreme的頻率超至1200/6000MHz,並穩定通過3DMark 11和3DMark FireStrike測試。那麼超頻後的迪蘭HD7870酷能+ 2G Extreme性能表現究竟如何,下面我們就一起來看下。
3DMark 11 Performance測試成績
3DMark 11 Extreme測試成績
3DMark FireStrike測試成績
3DMark FireStrike Extreme測試成績
通過該項測試可以看出,Radeon HD7870T在超頻至1200/6000MHz後,已將Radeon HD7950遠遠甩在身後,性能直逼公版Radeon HD7970。而在3DMark 11 Performan測試環節,Radeon HD7870T以9484分的成績超越Radeon HD7970(9253分),實力不容小視。
● Tahiti架構Radeon HD7870測試總結
至此,Tahiti核心Radeon HD7870的測試階段就正式告一段落。說實話,測試成績是我們之前沒有想到的。雖然Radeon HD7870T採用與Radeon HD7950/HD7970相同的Tahiti架構,但規格較Radeon HD7950減少一組,較Radeon HD7970減少二組,但通過測試可以看出,Radeon HD7870T大部分的測試成績均超過Radeon HD7950,並將Pitcairn架構Radeon HD7870遠遠甩在身後,看來Tahiti核心加默認925/6000MHz的高頻率佔了絕對的優勢。同時,與Pitcairn架構Radeon HD7870不同的是,Radeon HD7870T擁有Tahiti核心的全部優勢,特別是PowerTune自動超頻技術,讓Radeon HD7870T在性能和功耗上較Radeon HD7870有了更好的平衡。
第一款Tahiti架構Radeon HD7870
● Tahiti架構功耗劣勢再次顯現
雖然Radeon HD7870T的性能表現令我們意外,但Radeon HD7870T的功耗表現卻在意料之中,Tahiti核心在溫度和功耗上的劣勢再次顯現。通過前面的測試可以看出,雖然Radeon HD7870T的規格較Radeon HD7950減少一組,但溫度和功耗卻絲毫沒有降低(難怪Radeon HD7870T沒有公版產品,看來只有非公版散熱器才能搞得定了)。
GeForce GTX 660Ti的有力競爭對手?
● Radeon HD7870T將成為中高端顯卡市場新的選擇
根據Radeon HD7870T的參數,我們可以看出該顯卡的定位在Radeon HD7870和Radeon HD7950之間,但絕大部分性能卻超越Radeon HD7950。通過前面的測試也可以看出,部分遊戲的測試成績超過GeForce GTX 660Ti,性能直逼GeForce GTX 670。雖然首發的只有迪蘭HD7870酷能+ 2G Extreme一款產品,但1849元的零售價格確實誘人,中高端顯卡市場將會掀起新一輪的A/N之爭。
Radeon HD7950何去何從?
● Radeon HD7950何去何從?
高於公版Radeon HD7950的性能,低於公版Radeon HD7950的售價,非公版品質更高的元器件和效能更好的散熱器,很難想像這樣一款產品為什麼會出現,但是這樣的產品確實出現了,而且與原本的定位並不相符,難道Radeon HD7950要提前退出中高端市場?或者AMD顯卡新一輪的降價熱潮會提前來臨?目前官方還沒有任何的消息,我們只能繼續期待了。
迪蘭HD7870酷能+2G Extreme為中國大陸首款,也是唯一一款採用Tahiti架構設計的Radeon HD7870產品。迪蘭HD7870酷能+2G Extreme目前僅在京東商城銷售,對該顯卡感興趣的讀者可點擊連結進入產品頁面:http://www.360buy.com/product/807050.html
29迪蘭HD7870 酷能+ 2G Extreme詳細參數
Radeon HD 7870並非是一個新型號,但是使用Tihiti圖形處理器版本確是新鮮,我們知道Tihiti是用於Radoen HD 7900系列產品,此次通過縮減規格用於Radeon HD 7870,勢必會增加這個型號的競爭力,那麼它的性能幾何?讓我們通過詳細的測試來解讀這款產品。