它是一位的備受關注的「王者」。儘管它的對手發布於357天前,但它仍舊是一張A飯們翹首企盼的旗艦顯卡。它是一張被AMD定性為「最快,最強」的旗艦卡皇。
它是世人矚目的雙子皇帝:HD7990。
在幾經cancel傳聞之後,2013年4月24日北京時間下午1點,AMD終於正式發布了Tahiti時代的A卡卡皇——Radeon HD 7990。在距離Tahiti架構首次公布近兩年,距離首款Tahiti架構單芯旗艦Radeon HD 7970發布一年零四個月之後,這款單卡雙芯產品最終在形式上補完了Tahiti家族的全部重要成員。 即便算上Radeon HD 7970 GHz Edition,AMD產品線的單卡性能界限也已經有10個月沒有任何拓展了。Radeon HD 7990究竟擁有怎樣的性能表現呢?在接下來的測試中,我們將會為您帶來這個問題的答案。 如果您想參與Radeon HD 7990的預購活動,請點擊此處。
Radeon HD 7990
》現在去顯卡道轉轉《簀》看看今日最新文章《
》顯卡精彩美圖匯總《
● HD7990規格一覽
同Radeon HD 7970一樣,Radeon HD 7990基於Tahiti圖形構架,它集成了兩顆完整規格的低功耗HD7970晶片,所以擁有86億的電晶體規模。其運算資源總量因為這種疊加而提升到了4096個ALU,Texture Fetch Load/Store Unit則提升至恐怖的1024個,Texture Filter Unit增加到了256個,構成後端的ROP為64個。兩顆晶片的形式也為它帶來了共計12個64bit雙通道顯存控制器組合的384bit*2顯存控制單元以及容量達3072MB*2的顯存體系。
HD 7900 顯 卡 對 位 產 品 規 格 比 較 表 | |||||
產品名稱 | Radeon HD7990 | Radeon HD7970 | GeForce GTX690 | GeForce GTX680 | GeForce GTX TITAN |
市場定價 | 7999元 | 3399元 | 7999元 | 3999元 | 7999元 |
GPU代號 | Tahiti | Tahiti | GK 104 | GK 104 | GK 110 |
GPU工藝 | 28nm | 28nm | 28nm | 28nm | 28nm |
GPU電晶體 | 86 億 | 43 億 | 71 億 | 35.5 億 | 71 億 |
著色器數量 | 4096 | 2048 | 3072 | 1536 | 2688 |
著色器組織 | Vector×4096 | Vector×2048 | 1D×3072 | 1D×1536 | 1D×2688 |
ROPs數量 | 64 | 32 | 64 | 32 | 48 |
紋理單元數量 | 256 | 128 | 256 | 128 | 224 |
核心頻率 | 1000 MHz | 925 MHz | 915 MHz | 1006 MHz | 837 MHz |
著色器頻率 | 1000 MHz | 925 MHz | 915 MHz | 1006 MHz | 837 MHz |
理論計算能力 | 4.09 TFLOPs×2 | 3.79 TFLOPs | 2.81 TFLOPs×2 | 3.09 TFLOPs | 4.5 TFLOPs |
等效內存頻率 | 6000 MHz | 5500 MHz | 6008 MHz | 6008 MHz | 6008 MHz |
內存位寬 | 384 bit | 384 bit | 256 bit | 256 bit | 384 bit |
內存帶寬 | 288 GB/s | 264 GB/s | 192.3 GB/s | 192.3 GB/s | 288.4 GB/s |
內存類型 | GDDR 5 | GDDR 5 | GDDR 5 | GDDR 5 | GDDR 5 |
內存容量 | 3072 MB×2 | 3072 MB | 2048 MB×2 | 2048 MB | 6144 MB |
DX版本支持 | 11.1 | 11.1 | 11 | 11 | 11 |
HD視頻技術 | UVD3.0+VCE | UVD3.0+VCE | PureVideo HD+NVENC | PureVideo HD+NVENC | PureVideo HD+NVENC |
通用計算接口 | Stream | Stream | CUDA | CUDA | CUDA |
Radeon HD 7990的默認核心及顯存運行頻率為1000/6000MHz,核心頻率可以通過AMD Boost技術動態調節至950MHz,顯存帶寬288GB/S。擁有4.09TFlops*2的單精度浮點運算能力以及1.02TFlops*2的IEEE雙精度浮點運算能力。
Tahiti構架
與之前的Radeon HD 7970相比,Radeon HD 7990無論從架構還是從製造性層面來講均沒有任何區別。除了更高的頻率、默認電壓以及更低的功耗之外,最主要的一點改進來自Radeon HD 7970 GHz Edition上加入的AMD Boost功能,接下來就讓我們一起來看一看AMD Boost功能究竟有怎樣的特點吧。
● 控耗功臣——AMD Boost
伴隨著NVIDIA的GeForce GTX 680的發布,GPU Boost功能首次出現在了人們面前。該項技術可以透過動態分析GPU實時負載情況,以實時調節GPU默認運行頻率的方式在TDP上限之內儘可能的抬升顯卡的運行性能。由於存在TDP上限的限制,這種動態調節能夠在保證用戶獲得更多性能的同時維持顯卡的安全穩定運行。
作為最主要的改進,AMD在HD 7970 GHz Edition中同樣引入了名為「AMD Boost」的GPU頻率動態調節機制,但與NVIDIA的GPU Boost完全不同,AMD Boost的作用並不是提升顯卡性能,它的作用是通過降頻來保護GPU的運行安全。
相比性能挖掘,AMD版本的Boost技術更接近一個高負載保護機制
AMD Boost功能基於改進型的Power Tuner,AMD在新HD 7900系列,包括Radeon HD 7970 GE和Radeon HD 7950 BE的BIOS中加入了新的一檔P-State(運行頻率段位通稱,並非官方命名),該檔P-State對應新HD 7900的默認運行頻率以及默認運行電壓,在此基礎上又添加了將默認頻率降低50MHz和並使用更低電壓的P-State段位。在正常狀態下,運行遊戲應用以及測試程序所產生的負載如果未達到顯卡功耗設計上限,顯卡就會維持最高檔P-State。當某些特定的遊戲以及測試程序,比如Furmark導致顯卡的運行功耗超過設計上限時,AMD Boost功能會通過Power Tuner實時的將顯卡的默認運行頻率和電壓直接拉回到低位,同時降低GPU佔有率。
AMD Boost實際遊戲GPU狀態(HD7950 BE)
簡單來說,NVIDIA GPU Boost技術的目的和結果是在需要時在安全範圍內提升性能,它會在顯卡安全時實時動作,而AMD Boost技術的目的和結果則是在必要時通過降低性能來保證顯卡處於安全範圍內,進而降低整卡的實時運行功耗和溫度。它會在顯卡處於高負載時實時動作,而顯卡負載不高時它並不會介入運行過程,兩者的目的和意義是完全不同的。
Radeon HD 7990的默認頻率為1000MHz,當AMD Boost機制發揮作用時,它會自動降至950MHz甚至更低的水平,同時主動調低核心電壓。這一動作,是Radeon HD 7990能夠以雙8Pin維持整卡運行的重要原因之一。
● 異步運算引擎ACE全稱Asynchronous Compute Engine,譯為異步計算引擎。作為AMD GPU最前端的組成部分,它的實際作用其實與幾何以及光柵化等圖形過程並沒有直接的聯繫。ACE位於整個GPU的最前端管理任務隊列,它能將非單純幾何關聯任務的線程塊規整的直接分發給後面的ALU團簇,同時也能接受幾何引擎處理完畢的帶有幾何關聯的任務線程塊並完成接下來的發放工作。ACE是所有GPU任務的起點,它的存在和表現直接關係到了GPU進行圖形及通用計算任務時的效率表現。
Tahiti構架Dual ACE細節
由於ACE與幾何引擎直接相連,這種關聯關係也在一定程度上改變了構架的多邊形搏出能力,因此我們可以籠統的把它理解成前端/幾何引擎與線程管理機制的結合體。Tahiti中的Dual ACE不僅改變了RV870架構幾何性能較弱的局面,讓未來的GPU架構擁有幾何處理/線程處理能力同步提升的機會,更為AMD向並行處理構架的進化打開了大門。
Daul ACE首次出現於Cayman架構,區別於傳統的AMD架構,Cayman擁有了第二套完整的光柵化-幾何處理單元陣列,該陣列擁有Rasterizer、Hierarchical-Z以及Tessellator/Germetry等全部的前端資源體系,與原有的前端部分完全對等,並且與流水線中的線程仲裁器UTDP直接對應。
Cayman構架的Dual ACE
Dual ACE的價值是顯而易見的,它讓Cayman擁有了雙倍於RV870的幾何處理能力,這極大地改善了RV870在面對曲面細分等領域時的表現。同時,由於單位周期的三角形搏出能力也從1個提升到了2個,Dual ACE的出現讓Crysis這樣對於傳統多變形輸出能力有很大需求的遊戲也能獲益。最後,更快的光柵化處理能力帶來了更快的坐標變換和像素化速度,這降低了後續流水線步驟的等待延遲,從而為最低幀表現的提升提供了幫助。
Tahiti大幅提升的曲面細分性能
Cayman中Dual ACE的表現,讓AMD看到了提升體系線程管理能力以及宏觀並行度的好處,因此在Tahiti構架中,AMD對ACE進行了進一步的強化。根據AMD公布的數據,Tahiti架構擁有了4倍於Cayman的曲面細分能力,同時通用計算性能也有了長足的進步,這從側面表明Tahiti構架的線程能力較之Cayman有了更進一步的提升。
● ALU團簇:Compute Unit
Tahiti架構最大的改進來自ALU集群部分。與傳統AMD構架的VLIW結構ALU團簇不同,Tahiti構架的ALU集群撤消了來自超長字節指令的限定,所有ALU全部以SIMD的形式來完成吞吐,不再需要打包和解包的過程。在保留傳統的通用執行特色,比如執行bitcoin這樣暴力吞吐運算能力的同時,Tahiti架構的靈活度和運算效率也有了不小的提升。
在Tahiti構架中,ALU團簇的名稱從VLIW SIMD變成了Compute Unit,名稱的改變不僅標誌著功能及用途的變遷,更暗示了內部結構的方向性變化。Tahiti擁有32個CU單元,CU內部包含4組SIMD CORE,每組SIMD CORE由16個標準Vector ALU構成,所以Tahiti的一個CU單元擁有64個Vector ALU,32個CU單元合計擁有2048個Vector ALU。
Tahiti構架CU結構細節
除了負責浮點吞吐的SIMD CORE之外,Tahiti構架的每個CU單元還擁有在一個Scalar Unit,Scalar單元中包含Int ALU單元,可以用來處理整數指令以及特殊函數。另外,對線程效率至關重要的原子操作(Atomic)也在該單元中執行。
運算單元之外,Tahiti構架的每個CU還綁定了由Branch和Scheduler構成的二級線程控制機制,以及一個完整的Texture Array,Texture Arroy的作用與傳統AMD構架中的TMU基本相同,包含了完整的Texture Fetch Load/Store Unit以及Texture Filter Unit。
Intel Larrabee構架
由此不難看出,Tahiti構架CU單元的結構在邏輯層面上已經與Fermi構架的SM單元和Larrabee的Vector Unit存在極大的相似性。三者均由浮點吞吐部分(Tahiti的Vector ALU團簇,Fermi的SP單元集群,Larrabee的Vector集群),整數、特殊函數及原子操作部分(Tahiti的Scalar Unit,Fermi的SFU,Larrabee的Scalar pipeline)以及二級線程控制機制(三方的Scheduler等)。除此之外,CU還與Fermi的SM一樣擁有完整的Texture Arroy,甚至每一個運算單元(Tahiti的Vector ALU,NVIDIA的SP單元)都擁有完全相同的4K寄存器。
CU進行wavefront吞吐示意
一個CU/SM/Vector Unit就是一個獨立的處理單元,能夠面對一個標準的指令集群或者說線程塊,也就是AMD的wavefront以及NVIDIA的warp,但AMD目前上不存在類似half warp的線程塊子劃分機制。
Tahiti支持WinZip最新版帶來的Open CL加速
更新之後的CU單元在計算能力和效率方面有了長足的進步,不僅令Compute Shader處理能力大幅提升,進而提升了GPU在DirectX 11環境下的圖形性能,而且在通用計算領域也獲得了更加廣闊的前景和更多樣化的發展可能。
● 統一緩衝體系
Tahiti另一個巨大的改進來自緩衝體系的大幅調整。Tahiti架構的緩衝體系不僅對原有的GDS以及LDS等Shared資源進行了調整和重新布置,更引入了非常重要的多級unified cache。
不同於傳統的被所有VLIW CORE共享使用的整體GDS,Tahiti架構的每個CU擁有至少32K的獨立的GDS(Golbal Data Share),這個尺寸完全符合微軟在DirectX 11中的硬性規定。GDS中可以劃分出16K空間作為L1 Data cache,Tahiti構架的多級cache體系屬於包含式結構,L2保存了全部的L1數據且能夠允許L1數據進行回寫,結合AMD的官方描述,我們認為在宏觀範圍內Tahiti的Shared存在32K GDS+0K L1 Data cache+「16K L2 Data cache」或者16K GDS+16K L1 Data cache兩種組合方式。
Tahiti構架緩衝體系
除了GDS+L1共享構成的以及緩衝體系,Tahiti構架的每個CU還擁有獨享的LDS(Local Data Share),LDS在RV770以後的AMD構架中均有出現並為所有VLIW CORE共享,而此次在Tahiti中,LDS與GDS一樣被打散到了每一個CU中,變成了專享的二級補充Shared。
除了一級緩衝和Shared,Tahiti的CU單元還擁有共享的L1 Instruction cache和Kernel cache,每4個CU共享16K的L1 Instruction cache和32K的Kernel cache。
Tahiti構架緩衝體系細節(引自後藤弘茂blog)
最後,Tahiti構架擁有溝通上級緩衝與顯存的L2 Data cache,L2 cache與MC一一對應,因此Tahiti共擁有6組合計768K的L2 cache。L2 cache面向所有CU中的單元開放,ALU可以用它緩衝數據,TMU也可以用它充當Texture cache。
Fermi構架緩衝與單元的關係
整體來說,Tahiti的緩衝體系與Fermi存在很大的相似度,無論是可共享/切換的一級Shared/L1機制,還是面向所有單元並可以同時充當Texture cache的L2,Tahiti與Fermi在緩衝體上都已經處在了一致的狀態。兩者最大的區別,在於Tahiti採用了指令和數據緩存分離的方式,同時在L1與Shared的切換方式及尺寸上與Fermi存在差異。相對來說,Tahiti的切換及分配方式更加靈活多樣,但同時也對cache的操作切換控制提出了更高的要求。
● 無損各向異性過濾及DirectX 11.1支持
在Cayman發布時,AMD曾宣稱自己的各向異性過濾算法是世界上最好的算法,不僅性能近乎無損而且可視角度方面的表現也完美無缺。但事後有大量媒體證明,Cayman的AF實際上在部分場合會導致LOD錯誤、閃爍等問題,AMD於Cayman發布後也承認了該方面的問題。
新各向異性過濾細節
在此次的HD7970中,AMD引入了一種全新的非角度依賴算法,在解決Cayman紋理閃爍問題的同時提供了更好的AF性能表現。
全新的非角度依賴算法
通過新算法的引入,HD7970中的AF重寫了整個內核,AMD為其引入了全新的自動調用機制,並承諾不會再出現紋理閃爍以及波浪狀扭曲等錯誤,同時還承諾了新的AF算法將真正實現全角度有效。
DirectX 11.1技術細節之TBDR
除此之外,Tahiti構架的另一個重要特性在於DirectX 11.1的支持,DirectX 11.1中包含了DP Shader等諸多對未來圖形化過程有深遠影響的更新,可以說是一個具有開端意義的API升級。HD7970對DirectX 11.1特性提供了全面的支持,用戶可以在未來快速的進入全新API的應用環境,獲得全新的圖形體驗。
● 超長卡身的內在——HD7990拆解直播
Radeon HD 7990擁有超長的卡身尺寸,其散熱系統也採用了公版顯卡史上空前的3X92mm口徑風扇方案,接下來,就讓我們一起看一看這塊巨無霸的內含吧。
拆解準備
拆卸背板
GPU扣具拆卸
PCB背面用料展示
散熱器拆解
散熱器下面的HD7990本尊
Radeon HD 7990拆分細節
92mm大口徑風扇
熱管+均熱板結合的大尺寸散熱片
Radeon HD 7990
數字供電模塊
核心供電部分
PLX橋接晶片
海力士R0C顯存顆粒
用料細節
PCB背面細節
GPU晶片
13年第二周的特挑Tahiti晶片
經過一番努力,我們終於見到了Radeon HD 7990的真容。不得不說,我們已經很久沒有見過用料如此殷實的顯卡了。巨大的功耗對元件數量和品質均提出了極高的要求,這促使AMD為我們奉上了這樣一款給人「踏實感」的作品。
● 測試平臺硬體環境一覽
為保證測試能夠發揮顯卡的最佳性能,本次測試平臺由Intel酷睿i7-3960X處理器、技嘉X79晶片組主板、芝奇4GB DDR3-1600×4四通道內存組建而成。詳細硬體規格如下表所示:
測 試 平 臺 硬 件 環 境 | |
中 央 處 理 器 | Intel Core i7-3960X |
(6核 / 12線程 / 3.3GHz / 15MB L3) | |
散 熱 器 | Intel RTS2011LC |
(原廠水冷散熱器 / 選配件) | |
內 存 模 組 | G.SKILL RipjawsX DDR3-1600 16GB |
(SPD:11-11-11-28-1T) | |
主 板 | GIGABYTE GA-X79-UD7 |
(Intel X79 Chipset) | |
硬 盤 | Seagate Barracuda 1TB |
(1TB / 7200RPM / 32MB緩存 / SATA3) | |
電 源 | NERMAX 白金冰核 1500W |
(CSCI Platinum 80Plus/1500W) | |
顯 示 器 | DELL Ultra Sharp 3008WFP |
(30英寸LCD/2560×1600解析度) |
● 測試平臺軟體環境一覽
為保證系統平臺具有最佳穩定性,本次產品測試所使用的作業系統為Microsoft Windows 7正版授權產品,除關閉自動休眠外,其餘設置均保持默認,詳細軟體環境如下表所示。
測 試 平 臺 軟 件 環 境 | |
操 作 系 統 | Microsoft Windows7 Ultimate RTM SP1 |
(64bit / 版本號:7601) | |
主 板 芯 片 組 驅 動 | Intel Chipset Device Software |
(WHQL / 版本號:9.2.3.1022) | |
AMD 顯 卡 驅 動 | AMD Catalyst |
(Beta / 版本號:12.102.3-130412a for HD7990) | |
NVIDIA 顯 卡 驅 動 | NVIDIA Forceware |
(WHQL / 版本號:314.22) | |
桌 面 環 境 | Microsoft Windows7 Ultimate RTM SP1 |
(2560×1600_32bit 60Hz) |
在測試成績方面,理論性能測試用得分來衡量性能,數值越高越好;遊戲性能測試用FPS記錄平均幀數來衡量性能,數值同樣越高越好。
特別說明:為保證測試過程中AMD/NVIDIA驅動程序特效設置完全相同,我們調整了AMD催化劑驅動的AI控制功能,將鑲嵌等級從驅動默認的「AMD優化」改回「應用程式控制」。在這樣的設置下,AMD顯卡才會在遊戲中使用正確的遊戲自身設置的曲面細分等級,而不是AMD通過驅動預設的更低的曲面細分等級。
我們所有的理論測試均採用軟體預設畫質或單獨交代設置細節,遊戲測試則統一採用1920及2560兩個解析度下開啟全部特效及4XAA的設置來完成,如有調整會另行交代。所有參測顯卡均完成1920解析度遊戲測試,而2560解析度遊戲測試因性能因素只開放給Radeon HD 7950以及GeForce GTX 660Ti以上級別顯卡。
● 理論性能測試:3DMark FireStrike
於北京時間2013年2月5日推出的新3DMark,採用全新界面設計,除了測試分數,還會展現每個場景測試期間的實時曲線,全程記錄幀率、CPU溫度、GPU溫度、CPU功耗。新3DMark取消了傳統的E、P、X模式,取而代之的是根據負載不同所推出的三個場景,其中FireStrike專為基於DirectX 11顯卡搭建的高端遊戲平臺,而CloudGate則支持基於DirectX 10環境的主流硬體,IceStorm則支持入門級DirectX 9設備、手機、平板電腦等等。
3DMark FireStrike
新3Dmark測試結果
Radeon HD 7990運行新3Dmark成績及幀數曲線情況
在新3Dmark中,Radeon HD 7990取得了最高的單卡測試結果,結果細節及幀數曲線情況見上圖。
● 理論性能測試:3DMark 11
PC遊戲隨Windows 7的發布進入DirectX 11時代,眾多DirectX 11顯卡早已摩拳擦掌上陣廝殺,卻遲遲沒有一個權威性的基準測試軟體來衡量遊戲顯卡DirectX 11性能的高低。終於,DirectX 11時代的3DMark 11來到大家面前。3DMark 11使用原生DirectX 11引擎,測試場景包括Tessellation曲面細分、Compute Shader以及多線程在內的大量DirectX 11特性。
3DMark 11
3Dmark 11 extreme模式測試
因為某些原因,3Dmark11的測試結果對Tahiti架構的友好度並不如新3Dmark,但Radeon HD 7990依舊錶現出了出眾的性能。
● DirectX 11性能測試:Heaven Benchmark 4.0
Heaven Benchmark 4.0是一款專門測試DirectX 11效率的軟體,由俄羅斯Unigine遊戲公司自主研發的引擎設計。該軟體擁有類似阿凡達的懸浮島場景,其中龍雕塑運用了細分曲面技術,抱括島上的路徑和房子的磚塊等23個場景的測試得出顯卡的最終實際效能,並通過DirectX 11環境帶來很強的真實感。
Heaven Benchmark 4.0
天堂4.0極限環境測試
我們採用了極限環境的天堂4.0設置來完成測試,在單屏最高極限的重壓之下,Radeon HD 7990再次完成了對GeForce GTX 690的超越。
● 遊戲測試:Crysis3
《孤島危機3》是《孤島危機》的最新續作,遊戲採CryENGINE 3引擎所製作,其卓越的畫面表現以及精彩的劇情相信已無需多言。作為硬體殺手的第三代,只支持DirectX 11的Crysis3 PC版再次將遊戲的畫面精美程度和硬體需求提升到了新的高度。
孤島危機3
我們採用運行Origin平臺啟動遊戲並進行第一關流程至進入建築物為止,同時收集期間的平均幀數的方式來完成測試,測試進行三次,取平均成績作為最終測試結果。
2560解析度Crysis3測試
在最高特效設置環境下,Crysis3已經徹底取代二代成為了新的硬體殺手。在維持可玩性的前提下,Radeon HD 7990想要達到更好的流暢度看來還需要驅動進一步完善的協助。
● 遊戲測試:Crysis2
《孤島危機2》是《孤島危機》的續作,遊戲採CryENGINE 3引擎所製作,故事發生在距一代3年後的2023年。外星人在地球上的大片區域挑起了戰爭,各大城市都遭到攻擊,人口銳減,玩家將要進行捍衛地球的末日戰爭。
孤島危機2
我們採用Crysis2 BenchmarkTool來完成測試,場景選擇Downtown,測試進行三次,取最高成績作為最終測試結果。
2560解析度Crysis2測試
新一代硬體的性能提升在Crysis2中體現的還是很充分的,這位曾經的硬體殺手已經被Radeon HD 7990徹底徵服。
● 遊戲測試:Metro 2033
本作題材基於俄羅斯最暢銷小說Dmitry Glukhovsky。由烏克蘭4A遊戲工作室開發,採用4A遊戲引擎,而且PC版支持nvidia的PhysX物理特效。 2013年,世界被一次災難性事件毀滅,幾乎所有的人類都被消滅,而且地面已經被汙染無法生存,極少數倖存者存活在莫斯科的深度地下避難所裡,人類文明進入了新的黑暗時代。直至2033年,整整一代人出生並在地下成長,他們長期被困在「地鐵站」的城市。
地鐵2033
我們採取遊戲提供的Benchmark程序來完成測試,該Benchmark所包含的場景具有光照系統,煙霧系統以及激烈交戰場景,能夠全面反映顯卡在面對Compute Shader以及超高解析度材質時的表現。需要註明的是,有介於既往測試的經驗,我們在本次測試中關閉了所有參測顯卡的DOF選項設置,以期獲得「可以用來玩的幀數」數據。
2560解析度地鐵2033測試
在關閉了DOF選項之後,地鐵2033變得具有一定的可玩性了,但它依舊是我們所有測試遊戲中對硬體壓迫力最強的測試對象。Radeon HD 7990對於AMD陣營單卡性能的拓展是非常可觀的,我們認為驅動的完善能夠進一步提升該卡的表現。
● 遊戲測試:殺手5
《殺手5:赦免》採用IO Interactive自主研發的冰川2(Glacier 2)引擎製作,遊戲內容都是在引擎下實時進行反饋的,所有動作都是即時生成的。新作主要場景發生在芝加哥,名為代號47的主角在本作中將更加靈活,更好控制。他將可以攀在懸崖邊,還可以保持平衡,遊戲融入了掩護系統,挾持人持的功能回歸。
殺手5:赦免
我們使用遊戲自帶的Benchmark程序來完成設置,測試進行三次,取平均值為最終結果:
1920解析度殺手5測試
2560解析度殺手5測試
殺手:赦免是我們所有測試項目中表現最好的遊戲,Radeon HD 7990在該款遊戲中甚至表現出了1+1>2的水準。由此可見,驅動對於顯卡性能的影響還是十分巨大的,伴隨著驅動的進一步完善,Radeon HD 7990應該可以給我們帶來更好的性能體驗。
● Bitcoin算力測試
bitcoin(BTC,比特幣)是一個由Satoshi Nakamoto開發的具有分布式運算特徵的實驗性貨幣體系,它具有強烈的非央行依賴性和通縮特性。bitcoin的發行並不與一般本位物和衝物掛鈎,它的價值依靠自身2200萬的貨幣上限總量以及逐步攀升的獲取難度來維繫。bitcoin的獲取方式來自計算,它將任務廣播至網路中,每個參與者通過計算獲得bitcoin後都會增加下一枚bitcoin的獲取難度。當前bitcoin的運算內容主要為哈希加密算法,CPU/顯卡/DSP以及專門研製的ASIC均可直接計算。
bitcoin算力測試
以結果來看,Radeon HD 7990是目前挖礦算力最強的單顯卡。但關於挖礦以及Bitcoin,我們認為有兩點需要重點強調。
bitcoin採用的最基本的哈希算法是一種僅需要暴力窮舉能力的算法,它只要求最暴力的吞吐和最基本的處理能力,並不需要運算者強調靈活的任務處理效率,為靈活高效執行複雜任務而存在的大規模多級任務管理體系在這裡反倒有可能會變成效率的阻礙,處理任務越靈活高效的運算架構,處理bitcoin的效率也就越低。這就好比一個單位或者團體處理一件複雜龐大而且充滿變數的工程時,組織架構越細膩合理,現場應對能力和針對性越強,整體的工程進行效率也就越高。但如果把工程換成只是吃一碗炸醬麵,這事兒也要找8個中層領導打上10份報告的話,那效率就很難提升了。
以bitcoin的執行效率而言,整體情況嚴格遵循CPU<GPU<DSP<ASIC的順序,面對複雜任務時最靈活高效的CPU因為犧牲了吞吐能力,因此效率和性能功耗比都最低;同樣吞吐能力下越靈活越高效的GPU跑bitcoin的效率比也越低;犧牲一定可編程性和幾乎全部前端,藉以強調吞吐能力的DSP方案效率明顯超過GPU;而不可編程同時可以肆無忌憚的真對吞吐的ASIC方案效率最高。這是一個適合肌肉礦工的領域,挖礦者只需要肌肉不需要腦子,腦子想得越多,bitcoin挖的也就越慢,挖的越快同時能耗比越高的礦工,腦子也越簡單。用顯卡來挖礦究竟合不合適,諸位請自行判斷。
接下來,同時也是比前一點更加重要的事,就是bitcoin的合法性問題。bitcoin並不依賴於任何其他貨幣的最重要要素:受法律保護的一般等價屬性/對衝體系,它的價值沒有任何普適世俗觀點的認可,它的發行不需要黃金或者外匯儲備來維繫,卻能從世界各國的貨幣體系中隨時搬走實實在在的黃金或者鈔票,可以以完全的空手套白狼形式完成對實體貨幣體系的衝擊,同時其隱秘性還隱藏著被用來進行危險不合法交易的可能,因此其合法性以及受保護性可以說完全為0。實際上不僅沒有任何一部法律會對bitcoin的貨幣地位及擁有者所謂的財富進行承認和保護,甚至bitcoin還會因為前面提到的危險性而處在每時每刻都可能在被法律絞殺的風險。如果您打算介入bitcoin,我們強烈建議您三思而行。
● 測試總結:
區別於以往,我們沒有在本次測試的結尾繼續深入的討論Radeon HD 7990的意義,它的出現時機、它對AMD和NVIDIA當前以及未來的影響也同樣不在我們的探討範圍。這款產品的意義究竟如何,它是否能夠改變AMD和NVIDIA的命運及所處地位,還請屏幕前的各位自行判斷。
對於這塊卡的意義,我們不再深入探討
各位請自行判斷HD7990的意義
受限於驅動問題,我們只提供了上述遊戲及理論性能的測試結果。在其他ZOL測試規範包含的項目中,Radeon HD 7990目前還存在不少兼容性和CrossFireX無法正確生效導致的性能問題,基於同樣的原因,我們亦無法獲得該卡的滿載功耗及溫度表現情況。這一方面說明了AMD在驅動的道路上依舊任重道遠,同時也給我們留下了很多希望——Radeon HD 7990在完善驅動之後應該還有值得期待的性能提升和使用感受提升。
如果你真的支持AMD,請拿出實際行動
今天您所看到的關於Radeon HD 7990的種種,就是AMD在2013年二季度伊始為我們帶來的最新力作。如果您真的喜歡這款AMD新卡皇產品的表現,並且認同和支持AMD的舉動,那就請以實際行動來表達自己的感情,直接購買一塊來親身體驗一下吧。
參與Radeon HD 7990的預購活動,請點擊此處。
經過1年多的等待,我們終於迎來了全新的單卡皇者Radeon HD 7990,這款來自AMD採用Tahiti核心設計的雙芯產品在性能、功耗、噪音等方面都帶來了新的裡程碑,同時在「比特幣」方面的分布式計算更加犀利,讓我們看看這款產品的綜合實力吧!