泡泡網顯卡頻道10月22日 十三個月之前,AMD發布了業界首款DX11顯卡——Radeon HD5870/5850,由此確立了AMD在DX11時代的領先地位:高端產品領先對手半年,中端主流產品更是長達九個月都沒有競爭對手!在此後的五個月之內,AMD陸續推出了多達十一款不同規格的產品,構築了一條完整的DX11產品線。
曾經與Intel「摩爾定律」齊名的NVIDIA「黃氏定律」稱「在圖形處理器領域,每過半年GPU的性能提高一倍」,而NVIDIA到了DX11時代之後,似乎連「半年更新、一年換代」的承諾都做不到了,新品姍姍來遲、產品線殘缺不全、處境比較尷尬。
AMD並沒有因為對手的失誤而懈怠,也沒有沉浸在過去的輝煌當中,依然在按部就班的推陳出新。在第一代DX11顯卡發布一年之後,AMD又為大家帶來了第二代DX11顯卡產品——Radeon HD 6870/6850,那麼這一代產品又會給遊戲玩家們帶來什麼樣的新驚喜呢?
第一章 AMD和NVIDIA在顯卡發展過程中遇到的困難
第一章/第一節 半導體製造工藝制約GPU的發展
既然前面提到了「黃氏定律」,我們不妨來回顧一下「摩爾定律」,這條早在1965年提出的理論至今都依然有效,並且暗中左右著半導體晶片的發展,其大致內容是「集成電路上可容納的電晶體數目,約每隔18個月便會增加一倍,性能也將提升一倍。」
圖例:如果用1000nm工藝製造Core i7,其核心面積將會有一本書這麼大
「摩爾定律」最基本的涵義就是:半導體工藝需要一年半甚至更多的時間才能前進一代。但對於晶片級企業來說,如果這麼久的時間才推出一代產品的話,顯然是無法滿足市場需求的。於是Intel率先提出了Tick-Tock(工藝年-構架年)的戰略模式,在半導體製造工藝停滯不前的情況下,通過改進架構來提升性能,而在架構保持不變的情況下,通過更新工藝來提升性能改善功耗,兩種方案交替更新、相得益彰。
GTX260與HD4870賣同樣的價錢,大核心顯然要吃虧一些
近年來的GPU的發展也與CPU非常類似,GPU的電晶體規模比CPU更為龐大,更加迫切的需要先進位造工藝的支持。但目前只有臺灣島內的臺積電這家公司才有能力製造高度複雜的GPU,而最近臺積電在新工藝的研發方面遇到了些麻煩,進展不是很順利。
其實臺積電40nm工藝的投產就已經讓AMD和NVIDIA很頭疼了,它直接造成了HD4770以及HD5870/5770系列產能不足的局面,也讓NVIDIA的巨無霸核心GF100良率低下、功耗超高。現在臺積電又因故取消了32nm工藝的研發,轉而直接上馬28nm,但距離量產還十分遙遠。
AMD最初的規劃就是代號為「北方群島」(Northern Islands)的新一代圖形架構,準備採用臺積電32nm工藝製造,具體核心代號有Cozmuel、Kauai、Ibiza。但由於臺積電取消32nm,AMD不得不更改計劃,一邊等待新工藝、一邊使用現有成熟的40nm工藝、在上代產品基礎上開發改進型產品。
於是就誕生了代號為NI-40過渡型HD6000系列,保持40nm工藝不變,在現有架構的基礎上進行改良。但AMD並非只是小修小補而已,HD6000系列相比HD5000系列,無論核心架構還是外圍功能模塊、甚至顯示輸出部分都有了全方位的增強,後文中筆者會為大家進行全面的解讀。
第一章/第二節 AMD和NVIDIA的「甜蜜點」之戰
在AMD和NVIDIA官方提供的PDF技術資料中,多數內容都是針鋒相對的,重點強調自家的產品和技術比對方優秀,但有一個概念雙方都是完全認可的,被稱為Sweet Spot(甜蜜點):
那麼什麼叫做「甜蜜點」呢?最直觀的含義就是遊戲玩家需要一款什麼樣的顯卡:可以流暢運行最新遊戲、價格不要太貴、功耗發熱不能太高、功能還要豐富——聽起來似乎很完美。
世界上沒有完美的顯卡,想要獲得高性能,製造成本必然不低、功耗發熱自然不小。但如果能找到一個最佳的平衡點,在性能犧牲不是很多的情況下,大大降低製造成本和功耗發熱的話,那麼這款顯卡就是這個時期最接近於完美的產品,也必然最受玩家歡迎。
AMD和NVIDIA都意識到了這一點,因此近年來他們對旗艦級顯卡性能之王的寶座看得更淡了,反而是更加注重於提升中端千元價位顯卡的綜合實力——注意不僅僅是性能。所以我們看到,NVIDIA對於高端GTX480/470的失敗毫不在意,僅憑中端GTX460這一款產品就一舉扭轉敗局,獲得了廣大玩家的一致認可,AMD看似密不透風的HD5000產品線瞬間被撕開了一條裂縫,大量市場份額被搶走。
AMD在DX11時代的成功是有目共睹的,NVIDIA方面能拿得出手的也就只有GTX460這一款產品而已,AMD當然不甘心輸給它。於是全新的一代HD6000系列準備就緒之後,最先發布的產品,就是定位中端的HD6870和HD6850,目標直接瞄準GTX460。
第一章/第三節 Radeon HD6000系列產品線解析和HD6870/6850定位分析
HD5800系列所使用的Cypress核心是一顆不大不小的GPU,AMD在40nm工藝尚未完全成熟的情況下,製造出了一顆擁有21.5億電晶體的晶片,擁有非常不錯的性能,而且功耗發熱控制以及良品率都比較理想。
而NVIDIA方面用40nm工藝製造出了一顆擁有30億電晶體的怪獸GF100核心,事實證明這顆核心太大、太熱、良率太低,以至於至今都沒有完整版出現,閹割版GTX480/470也草草退場。
Cypress作為一顆一年前的核心來說,它已經非常成功了,也勝利完成了自己的歷史使命。但如果以現在的眼光來看的話,Cypress核心有點兒高不成低不就的感覺,它的性能做為旗艦顯卡來說不夠強大,作為中端顯卡來說成本又太高了,用它降低身價去對付GTX460不太合適。
HD5000產品線細分方案
於是AMD在設計新一代產品的時候,準備對GPU做進一步的細分,高端造一顆比Cypress更大的核心,代號為Cayman;中端造一顆比Cypress略小的核心,代號為Barts;而旗艦級產品則繼續採用雙核心戰略,用兩顆Cayman組成代號為Antilles的怪獸。
HD6000產品線細分策略
如果按照AMD在HD5000系列那種命名方式的話,Antilles應該被命名為HD6900,Cayman命名為HD6800,Barts命名為HD5700。
但由於Barts的性能高於預期,而NVIDIA方面的GTS450又不給力,HD5700系列產品紛紛表示壓力不大,AIB們個個情緒穩定,因此AMD臨時決定把HD5700系列改名為HD6700接著賣(小道消息、未經AMD官方確認)。如此以來,新一代的Cayman、Barts核心命名都得往上調一檔。
最終,基於Barts核心的兩款產品被命名為HD6870和HD6850,基於Cayman核心的兩款產品被命名為HD6970和HD6950,而雙核心的Antilles被命名為HD6990。
第二章 HD6800系列圖形架構解析
通過上一章節的分析,我們知道NVIDIA和AMD對於中端GPU核心的設計都投入了高度重視,NVIDIA之前發布的GF104核心雖然與GF100屬於同一代產品,但核心架構方面的改進非常多。現在AMD也對新一代中端產品做了諸多改良,我們一起來看看。
第二章/第一節 HD6800核心架構圖
下圖為AMD官方公布的Bart(HD6870/6850)核心架構圖,看上去和Cypress(HD5870/5850)並無太大區別,整體依然沿用了自R600(HD2900XT)以來的SIMD(單指令多數據流)架構,流處理器部分沒有太多改進,歷代產品的改進都是集中在周邊控制模塊上面。
★ Barts(HD6870)核心架構圖
★ Cypress(HD5870)核心架構圖
從Cypress到Barts最明顯的改變就是,SIMD陣列從原來的20組降為14組,這樣流處理器數量就從1600(20x16x5)個減至1120(14x16x5)個,正好與現有HD5830的流處理器數量相等。
也就是說Barts相比Cypress,流處理器數量是70%,電晶體規模是79%,晶片面積是68%。
★ 主流顯卡規格對比:
可以看出,HD6870的理論性能和規格,其實還不如HD5850,而HD6850也不如上代的HD5830,那麼其優勢到底在哪呢?
第二章/第二節 Barts擁有兩個超線程分配處理器
我們知道,NVIDIA從GF100到GF104,雖然CUDA核心方面的改進不大,但對SM(流處理器簇)整體架構進行了重新的排列組合,部分指令分配單元和特殊功能單元被增強。NVIDIA的MIMD(多指令多數據流)架構將並行指令的調度單元、分配單元都和特殊功能模塊設計在了GPC(圖形處理器集群)或者SM(流處理器簇)內部。而AMD的SIMD(單指令多數據流)架構則是整顆GPU共享單一的控制單元,自R600以來都是如此。
Cypress的單一圖形裝配引擎
但隨著電晶體規模和流處理器數量的迅速膨脹,單一的控制單元已經無法滿足大規模並行指令分配的需要,因此從Cypress開始,AMD採用了「雙核心」的設計,將SIMD陣列一分為二,也就是類似於NVIDIA GPC的設計。與此相對應的,圖形裝配引擎雖然只有一個,內部卻設計了兩個Hierarchical Z(分層消影器)和Rasterizer(光柵器),但是其它的特殊功能模塊均只有一個。
Barts的圖形裝配引擎
Barts和Cypress一樣,依然保持了雙核心設計,圖形裝配引擎也只有一個,內部的功能模塊並沒有太多變化。但是Ultra-Treaded Dispatch Processor(超線程分配處理器)卻變成了兩個,相對應的,超線程分配處理器的指令緩存也變成了兩份。
我們知道,Barts的流處理器數量是Cypress的70%,按理說線程分配壓力有所下降,那麼設計兩個線程分配處理器的目的只有一個,那就是提升效率。在DX11時代,幾何著色再加上曲面細分單元引入之後,圖形裝配引擎會產生更多的並行線程及指令轉交SIMD進行處理,因此分配效率成為了新的瓶頸。
SIMD架構的優勢就是可以用較少的電晶體製造成龐大的流處理器規模,擁有恐怖的理論運算能力;但缺點就是流處理器執行效率比MIMD架構低,其效率高低完全依賴於分配單元的派發效率。因此Barts這種雙線程分配處理器的設計意義重大!
第二章/第三節 增強的曲面細分單元
在Barts核心的圖形裝配引擎內部,還有一個毫不起眼的變化,那就是Tessellator(曲面細分單元)升級到了第七代,那麼這一代到底有什麼改進呢?
我們知道,NVIDIA GF100核心內部擁有多達16個曲面細分單元,GF104核心也有8個之多,而AMD的HD5000全系列都只有1個曲面細分單元,現如今HD6000系列還是維持全局共享1個的設計不變,其低下的曲面細分性能成為了NVIDIA攻擊AMD最充分的理由。
HD6000系列可以說是半代改進的架構,既然數量上維持不變,就只能從改進效率的方面考慮了。而改進的內容就是加強線程管理和緩衝,也就是上頁我們介紹過的「雙倍的超線程分配處理器和指令緩存」。
根據AMD官方提供的數據來看,HD6870的曲面細分性能最多可達HD5870的兩倍,這種情況出現在10級左右的中等細分程度,當曲面細分達到20級以上的時候,那麼它們的性能就基本上沒有區別了。
由此可見,Barts核心當中的Tessellator單元本身在性能方面應該沒有改進,其性能提升主要源於兩顆超線程分配處理器。中等級別的曲面細分在指令分配方面是瓶頸,Barts改進的架構消除了這一瓶頸,所以性能提升十分顯著,但如果細分級別特別高時,Tessellator本身的運算能力將成為瓶頸,此時線程派遣器的效率再高,也無濟於事。
第二章/第四節 曲面細分的正確方法
通過前文的分析我們可以知道,HD6000在曲面細分方面的改進其實與雙線程分配處理器是一回事,性能提升也是在特定的情況下才會出現。但總的來說還是能有1.5倍-2倍的提升,這對於消除A卡在Tessellation方面的瓶頸還是很有意義的。不過,AMD還是堅持認為當今的GPU和遊戲尚不需要特別強悍的曲面細分能力,簡而言之就是「曲面分得太細並不能讓圖形畫質變得更好,但卻會造成圖形性能大幅下降」。其實,筆者也認同這種觀點,但曲面細分性能也不能太弱。
下面我們就看圖說話,筆者選擇了目前曲面細分級別最高的一款DX11 Benchmark程序和NVIDIA官方曲面細分演示Demo進行說明:
★ 天堂2.1當中Extreme級別的曲面細分
以下三張截圖是最強A卡HD5970在1920x1080 4AA16AF模式下運行Heaven 2.0時獲得的,從上到下依次為關閉曲面細分、普通級別曲面細分和極限模式曲面細分,大家可以點擊放大對比細節差異:
Heaven 2.0 Tessellation Off,FPS=69
Heaven 2.0 Tessellation Normal,FPS=33
Heaven 2.0 Tessellation Extreme,FPS=16
可以看出,Tessellation從無到有所帶來的畫質改進是質變,石塊、臺階、瓦片的立體感十分強烈,相應的光影效果也很到位。然後將Tessellation級別從Normal提升至Extreme時,凹凸立體感並沒有太大變化,Normal模式已經足夠出色了,過高的細分級別並不會帶來更佳的畫質,但卻大大加重了顯卡的負擔,FPS損失非常慘重。
Heaven是款不錯的DX11 Benchmark程序,其1.0版本是基於HD5000而開發的,Tessellation只有Normal級別。在GTX480發布之後,很快就誕生了2.0版本,其測試場景並沒有太大變化,最核心的內容就是將Tessellation提升至Extreme級別,大家可以發現,片面提升曲面細分的結果就是:除了FPS暴降之外很難看出畫面有什麼提升!
然後通過測試成績我們就可以發現,Heaven 1.0的成績是很正常的,四款顯卡的性能表現完全在意料之中。而在Heaven 2.0當中,局勢完全被逆轉,GTX480超越了雙核的HD5970,GTX470都大幅領先與HD5870。這組成績確實證明了GTX480和GTX470在重度曲面細分環境下擁有非常出色的效能,而HD5000將會出現嚴重瓶頸導致效能大降,但實際上卻沒有多少實際意義,因為加重曲面細分級別並沒有帶來畫質改善,那麼我們憑什麼非要開到Extreme級別呢?
★ NVIDIA自家DX11 Demo Island11,100級Tessellation有必要嗎?
關閉Tessellation與25級Tessellation的區別,即便縮略圖都能看出來
默認50級與最高的100級的區別
上圖為GTX480發布時NVIDIA同步放出的一款DX11演示Demo,通過Tessellation構建了波瀾壯闊的水面,確實非常有創意。該Demo默認的Tessellation細分級別為50(可以認為是自動插入頂點的數目),將其加大到100級之後,GTX480依然能夠流暢自如,而HD5870則只有個位數。
但是,50級和100級的畫面真有區別嗎?恐怕拿著放大鏡也很難看出來,事實上即便是25級的Tessellation,畫面已經非常好了,到了一定的精度就不會有什麼效果了。
★ 小結:現階段的遊戲不需要太高級別的曲面細分
綜上所述,通過兩款曲面細分的代表Demo截圖我們就會發現,當今的遊戲其實並不需要把曲面分得太細,只要將插值頂點的數目控制在一定的範圍之內,畫面就非常精細了,盲目提高插值級別的做法沒有太大意義,可謂是得不償失。
事實上,當今所有的DX11都是這麼做的,雖然使用了Tessellation技術,但都只是蜻蜓點水、適可而止,即便如此已經可以讓遊戲畫面得到很大的改善。遊戲不同於技術演示Demo或者SDK,而是本著實用化的原則,追求高效率運行,而不是專門用來刁難顯卡的。
也就是說,以現有HD5000的Tessellation運算能力,是完全足以勝任今後較長一段時間內DX11遊戲的需要。GTX480/470雖然擁有N倍於HD5000的Tessellation運算能力,但除了能夠在為數不多的幾款Demo當中蹂躪A卡外,似乎並沒有其它用途。等到未來遊戲真正需要更強的曲面細分性能時,當今的頂級顯卡可能幾百塊錢處理都處理不掉了,未來的遊戲同樣需要更強的浮點運算能力,而不是片面注重某一特定技術的性能。
第二章/第五節 架構解析:改進AA和AF畫質效率
從G80時代開始,NVIDIA不滿足於業界標準MSAA(多重採樣抗鋸齒),推出了自己的CSAA(CoverageSamplingAnti-Aliasing,覆蓋採樣抗鋸齒)標準,從而實現了更高的精度和更佳的效率。
很多遊戲除了傳統的MSAA外,都內置了CSAA支持
而AMD也不逞多讓,爭鋒相對的推出了CFAA(Custom Filter Anti-Aliasing,定製過濾抗鋸齒),實現了更高倍數的抗鋸齒模式。但是這種CFAA並沒有得到遊戲廠商的認可,因為這種自定義擴大採樣色彩採樣範圍的抗鋸齒模式,會出現將物體邊緣變模糊的現象。
WOW打開CFAA後,花草還有文字都變模糊了
從G80發布至今,NVIDIA的CSAA技術得到了越來越多遊戲開發商的認可,相信很多玩家都注意到了,現在不少遊戲都直接在菜單中提供了CSAA選項,N卡用戶不用進入驅動控制面板就能非常方便的調用。而AMD的CFAA雖然從HD2000時代已經沿用到了HD5000時代,但幾乎無人問津。
終於到了HD6000時代,AMD拋棄了實用價值並不高的CFAA,開發了一種新的抗鋸齒方案——Morphological AA,直譯為形態抗鋸齒。這種抗鋸齒採用了DirectCompute計算技術來進行高效率的後處理器過濾,
新的抗鋸齒模式適用範圍比傳統的MSAA更廣,而且精度最高可達24x,效率方面比SSAA(超級採樣抗鋸齒)快很多,與最高精度的CFAA差不多,但畫質要更好。
除此之外,HD6000系列還改進了AF(各項異性過濾)算法,使得紋理材質的清晰度和畫質進一步提高,且不至於出現失真和變形。每一代新產品出現後NVIDIA和AMD都會強調AF畫質和效率會更好,事實上它們前幾代產品已經做得足夠好了,新的改進除了用專業測試軟體才能看出很小的區別外,在普通遊戲中誰會注意到如此微不足道的變化呢?
第二章/第五節 架構解析:UVD3.0支持DIVX/XVID硬解碼
在3D引擎部分,Barts核心相對於Cypress的改進並不多,只有超線程分配處理器、指令緩存、曲面細分模塊和AA/AF算法這些。
從架構圖中我們可以注意點,AMD的UVD(Unified Video Decoder,通用視頻解碼器)引擎現在升級到了第三代:
上圖非常直觀的揭示了UVD三代引擎在功能方面的改進,UVD2主要是加入了對即將淘汰的MPEG-2編碼的硬解支持,讓CPU佔用率進一步下降,性能方面接近於NVIDIA VP3引擎。
★ UVD3引擎改進之一:MPEG-2完全硬解碼
UVD3的改進最為徹底,MPEG-2編碼最複雜的熵解碼部分也可以支持硬解了,從而實現了完全硬解碼,達到了NVIDIA VP3的水平。不過對於這種即將被淘汰的編碼進行改進並不是UVD3的重點。
★ UVD3引擎改進之二:多屏、超高解析度、多路視頻流、3D藍光硬解碼
UVD3最有價值的改進就在於對與Eyefinity多屏應用模式下,超高解析度視頻解碼的支持,以及多路視頻流解碼支持,還有3D藍光硬解碼支持。
★ UVD3引擎改進之三:加入了DivX/xVid視頻硬解碼支持
目前網際網路上流行的很多盜版電影都是採用了DivX壓縮格式,主要集中在DVDrip以及部分720p高清視頻電影方面。另外新興的XviD標準也因為更高的壓縮率和畫質在迅速成長。這兩種由MPEG-4衍生出來的視頻編碼有著為數不少的影片(尤其是日本動作片)。
低解析度的DivX/xVid視頻碼率並不高,對於CPU要求較低。但近年來也有朝著高清發展的趨勢,解析度提高之後的影片由於其壓縮率很高因此解碼時的CPU佔用率並不低。此次UVD3解碼器對DivX和Xvid提供了支持,可謂是民心所向。
★ UVD3引擎改進之四:視頻畫質接近滿分
根據AMD官方公布的數據來看,在HQV Benchmark 2.0測試中,HD6870幾乎可以達到滿分的成績,遠勝過NVIDIA最新的GTX460顯卡,和Intel的整合顯卡不在一個檔次。
HD6000系列採用了全新的後處理器算法,並且提供了增強的視頻增強選項,進一步穩固A卡在輸出畫質方面的領先地位。
第三章 AMD顯卡最近特色功能解析
第三章/第一節 HD6870/6850支持最新的DP 1.2和HDMI 1.4a標準
與UVD3引擎一同改進的,還有Eyefinity 2D輸出引擎。Eyefinity技術可以外接的顯示屏數量還是維持在6個,但是接口標準和定義都得到了全面增強,AMD公版HD6870/6850的接口種類也發生了變化:
★ 支持目前最先進的DisplayPort 1.2、HDMI 1.4a標準
HD6870/6850同時支持當今最先進的DisplayPort 1.2和HDMI 1.4a,其中DP1.2的規格十分強大,數據帶寬比上代直接翻番,實現了單個接口4096x2160 @ 60Hz的超高解析度!
而且DP1.2還支持多通道數據流傳輸技術,可以用一個接口連接幾個顯示設備,並且顯示完全不同的畫面。
而HDMI 1.4a的意義就在於,它可以兼容目前市面上最新的3D電視、投影儀等設備,以往的HDMI 1.3標準是無法支持這些3D設備的。
★ HD6870/6850公版卡接口解析,支持多流輸出
HD5000系列的標準接口配置是雙Dual-Link DVI、DisplayPort、HDMI,其中兩個DL-DVI佔據了4個顯示通道,DP和HDMI各一個,這樣就把Eyefinity的6個通道都用完了。
而HD6870/6850的標準接口配置則是一個Dual-Link DVI、一個Single-Link DVI、HDMI、兩個Mini-DP。外觀上是把一個普通DP替換成了兩個Mini-DP,實際上是從原來的DL-DVI中拆分出來了一個顯示通道,多做了一路DP輸出。
這樣做的好處就是,一片顯卡可以直接接駁任何類型的數字顯示設備而不需要轉接,另外HD6870/6850的所有六個顯示通道都可以直接輸出,而不需要購買專用的6-DP特殊版顯卡。
公版HD6870就能支持六路輸出
這個功能是利用了DP 1.2標準當中的多流傳輸技術,通過專用的適配器,將一路Mini DP轉接為三路,這樣兩路Mini-DP就能輕鬆支持六屏輸出。而且轉接出來的六路通道並不局限於DP接口,HDMI、DVI、VGA等常見的接口都可以兼容。如此一來,Eyefinity技術的實現難度還有兼容性將大大增強。
第三章/第二節 架構解析:AMD HD3D技術解析
不得不承認,NVIDIA是一家很有遠見的公司,一年多前就研發成功的3D Vision立體顯示技術,現在已經成為整個IT業界的發展趨勢。而AMD的3D立體顯示技術才剛剛開始得到採用。
首先在硬體方面,只要能夠支持120Hz刷新率的輸出,就可以在PC上實現3D顯示技術。而想要在平板電視和投影儀上實現3D輸出的話,就需要高帶寬的HDMI 1.4a標準的支持,現在HD6870/6850率先做到了。
顯示設備方面的支持也不是問題,市面上主流的3D電視、投影儀,還有120Hz LCD或者雙面板LCD都能支持ATI顯卡。
當然,最關鍵的還是在軟體方面。同GPU物理加速一樣,AMD仍然倡導開放的標準,因此AMD積極與第三方3D顯示驅動供應商合作,能夠支持iZ3D和DDD這兩種3D轉換方案,並且兼容多種3D視頻播放軟體,對於3D顯示設備以及3D眼鏡也都是來者不拒。
開放式的解決方案由於成本較低,選擇範圍比較廣,因此受到了很多OEM廠商的親睞,目前已經有不少筆記本和一體機採用了基於ATI顯卡的3D顯示解決方案,但開放式的標準比較多,如果並非OEM集成式方案的話,安裝操作就較為複雜,因此AMD的HD3D方案在DIY領域並沒有什麼作為,知名度遠不如NVIDIA的3D Vision。
目前AMD的3D顯示技術,無論效果、兼容性還是軟體支持度方面,都絲毫不差於3D Vision。無論是對於3D遊戲的立體化,還是2D視頻的3D化,都得到了主流媒體播放器的支持,而且AMD的新一代UVD3引擎還能支持3D藍光硬解碼,可以說已經相當成熟了。
第三章/第三節 特色功能:AMD Stream視頻轉碼應用
CUDA是NVIDIA顯卡的一大賣點,它能夠將GPU龐大的運算能力釋放出來,對非3D遊戲應用軟體進行加速,實現比純CPU運算更快的效能。CUDA目前雖然有很多種類的軟體,但最主要的應用還是集中在視頻編輯和轉碼方面。
AMD方面與之相對應的技術叫做Stream,Stream相關軟體的數量雖然與CUDA有一定的差距,但近年來AMD也投入了很高的重視,與眾多知名的軟體開發商展開了密切合作,儘快的加入對Radeon顯卡的優化支持,讓A卡用戶也能體會到GPU加速所帶來的快感。
目前使用率最為廣泛的PowerDVD視頻倍線、MediaShow照片人臉識別、PowerDirector視頻編輯、MediaShow視頻轉碼等應用,都可以支持使用A卡進行加速,性能提升非常顯著。這些以往都是N卡的專利,現在A卡用戶也能達到相同的效果了。
此外,AMD新一代的UVD3引擎,還可以直接為視頻轉碼軟體輸出視頻源數據,這樣就能在大大降低CPU和GPU佔用率的同時,顯著提升視頻轉碼速度。而以往在視頻轉換時,視頻解碼的任務要麼是CPU運算,要麼是GPU的流處理器部分運算,佔用率都比較高。
第三章/第四節 特色功能:AMD開源物理加速技術解析
NVIDIA的物理技術PhysX收購自Agiea公司,僅能用於自家GeForce GPU。AMD此前選擇了應用更廣泛的Havok,既能在GPU上也能在CPU上執行,但是Havok已經被Intel收歸麾下,GPU加速技術被雪藏,於是AMD又不得不選擇了免費開源的大型實時物理引擎Bullet Physics。
日前,AMD已經正式公布了與Trinigy的合作進度,並且攜手開發了一款基於DX11引擎、DirectCompute加速的物理演示Demo,通過公布的視頻和截圖來看,無論畫面表現力,還是物理效果的逼真程度,都堪稱一流。
此番展示的DEMO名為「Mecha Warrior」,其中有一個機甲戰士在大城市中來回穿梭,一路破壞製造大量碎片,而這些效果都是利用Radeon HD 6800系列顯卡配合Bullet Physics物理引擎完成的,速度相當流暢。
這款物理演示Demo是通過大名定定的Maya 2011製作而成的,AMD為其開發了免費的插件,使得程式設計師可以在現有的基礎上,較快的開發出優秀的圖像引擎。開源的魅力就在於此,相信未來會有更多基於A卡的物理加速演示出現在大家面前。
不過,目前AMD最大的問題是,雷聲大雨點小,還沒有任何一款遊戲甚至公版的Benchmark/Demo能夠支持A卡的GPU物理加速。希望AMD能夠加大與遊戲開發商的合作力度,將優秀的開源物理引擎整合到遊戲當中,帶給A卡用戶們全新的遊戲體驗。
第四章 HD6870/HD6850顯卡實物解析
第四章/第一節 AMD原廠HD6870公版卡高清大圖賞析
首先我們來看一組AMD官方提供的公版卡美圖,這些圖片沒有打上任何第三方Logo,喜歡的朋友們可以點擊放大保存收藏:
第四章/第二節 AMD原廠HD6850公版卡高清大圖賞析
接下來是公版HD6850顯卡的高清大圖,HD6850的外觀和HD6870基本一樣,只不過PCB要稍微短一截,散熱器也略有不同。
第四章/第三節 AMD原廠HD6850公版卡高清大圖賞析
這是我們收到AMD送測的HD6870公版顯卡的實拍圖:
外觀方面之前AMD官方美圖已經有了全方位的欣賞,那麼下面就直接對HD6870進行拆解,看看其做工和用料如何:
HD6870的整體設計風格相比前代並沒有沒有變化,但顯卡供電被轉移到了PCB前端,這可能是改用了傳統PWM供電之後,電感體積較大的關係,如果設計在PCB尾部會有一定的高度,佔據渦輪風扇的位置。
Barts核心真身,比Cypress要小很多
Barts核心擁有17億個電晶體,1120個流處理器,默認核心頻率高達900MHz,看來AMD對於臺積電40nm工藝的運用已經到了爐火純青的地步,突破1GHz大關指日可待了。
現代0.4ns GDDR5顯存顆粒,單顆32Mx32bit,8顆組成1GB 256bit的規格
HD6870所使用的顯存與HD5870/HD5770相同,0.4ns的顯存理論運行頻率可達5000MHz,而HD6870的默認顯存頻率只有4200MHz,和HD5870/5770默認4800MHz的差距比較大。
HD6870的供電部分,採用了核心四相、顯存控制器一相、顯存一相的六相供電模塊,AMD放棄了ATI原廠風格的數字供電模塊,而改用了常見的PWM模擬供電,更有利於成本控制。但是8顆顯存僅使用1相供電,這樣並不利於顯存超頻,這可能是HD6870默認顯存頻率較低的主要原因。
散熱器外觀雖然四方四正,但結構和以往的公版卡沒什麼區別,散熱片部分為銅底、熱管、鋁鰭片,渦輪風扇側吹式風道接口。這種散熱器散熱效率相對較低,但優勢就是可以把顯卡發出的熱量全部排出機箱之外,不給機箱散熱造成負擔,因此AMD和NVIDIA公版卡最喜歡用這種結構。
輸出接口比較多,因此留給排風口的空間只剩下半個PCI擋板了。HD6870這五個接口的定義在前文中已經詳細講解過了,這裡就不再重複。AMD沒有直接設計6個Mini DP接口,安置了這麼多種類型的接口,就是為了能夠兼容市面上所有的顯示器,其中DVI接口還能轉接成為D-SUB兼容模擬設備。
第四章/第四節 顯卡解析:XFX HD6850顯卡實物拆解
AMD此次並未送測原廠HD6850顯卡,因此這裡我們使用XFX的HD6850進行拆解,這款HD6850的PCB和做工用料都採用了公版設計,但輸出接口和散熱器是非公版方案。
外觀與AMD公版完全不同,但也比較好看,純黑的外殼和PCB是XFX訊景最常見的風格。
HD6870的PCB明顯要比HD6870短一截,但各種元件的布局非常類似,只不過更加緊湊。
HD6850所採用的Barts核心,被屏蔽了2組SIMD陣列,流處理器減少為960個,紋理單元也同比減少,但光柵單元和顯存部分則沒有縮水。默認核心頻率為775MHz。
顯存顆粒也還是現代0.4ns,1GB 256bit的配置,但默認頻率被降至4000MHz,和HD5850一個水平。
HD6850供電部分的設計,基本與HD6870一致,核心本來也是4相式設計,不過由於精簡了流處理器、頻率還比較低,因此只要3相就夠了,而顯存控制器和顯存各1相。整卡功耗得到進一步控制之後,外接供電接口只需要1個6pin都夠了,另外一個空焊。
XFX HD6850的散熱器並沒有使用公版渦輪側吹式設計,而是比較常見的太陽花型直吹方案,這種結構的散熱效率很高,但缺點就是熱量會殘留在機箱之內。
XFX這款HD6850,在輸出接口部分沿用了上代HD5870/5850的設計,只有一個大DP,默認可以支持三屏輸出,但無法實現六屏輸出。
第四章/第五節 首批上市顯卡:XFX HD6870
我們第一時間受到了XFX送測的HD6870顯卡,這款顯卡完全採用了公版設計方案,只不過在公版散熱器上貼上了自家Logo貼紙,因此就不多做介紹了。
顯卡接口也保持了公版的方案,但出風口部分設計了XFX的Logo,顯得比較有個性。
第四章/第六節 首批上市顯卡:藍寶石 HD6870
第四章/第七節 首批上市顯卡:藍寶石 HD6850
第四章/第八節 首批上市顯卡:迪蘭恆進 HD6870
第四章/第九節 首批上市顯卡:迪蘭恆進 HD6850
第四章/第十節 首批上市顯卡:微星HD6870
第四章/第十一節 首批上市顯卡:微星HD6850
微星這款HD6850是唯一保持原廠公版風格的HD6850,PCB和散熱器以及輸出接口都與AMD提供的照片一致,我們一起來看看:
第五章 顯卡性能全方位測試
第五章/第一節 測試平臺與測試方法說明
★ 測試模式與測試方法:
此次發布的兩款顯卡定位中高端的遊戲玩家,性能十分強勁,測試時所有遊戲中儘可能開啟全部特效,包括內置的抗鋸齒(AA)和各向異性過濾(AF)。遊戲最高提供8xAA就開8x進行測試,只有4x就開4x,沒有的話就不強制開啟。雖然有些遊戲提供了更高精度的16xCSAA,但由於A卡不支持這種抗鋸齒模式,沒有可對比性,所以不做測試。
解析度只測目前最主流的全高清1920x1200,更高的2560x1600由於30寸顯示器太昂貴,非普通玩家所能承受,因此不做測試。目前也有很多顯示器是1080p(1920x1080),遊戲在這種解析度下的性能表現與1920x1200差不多,FPS稍高一點點,使用這種顯示器的朋友依然可以參考我們的測試成績。
★ 測試平臺配置:
PCPOP.COM評測室
硬體系統配置
處理器
AMD Phenom II X6 1090T
(3.2GHz , L3=6MB , 6 Core)
主 板
ASUS Crosshair IV Formula
(AMD 890FX Chipset)
顯 卡
HD6870 1GB (900/4200MHz)
HD6850 1GB (775/4000MHz)
HD5870 1GB (850/4800MHz)
HD5850 1GB (725/4000MHz)
GTX470 1280MB (608/1215/3348MHz)
GTX460 1GB (675/1350/3600MHz)
內 存
CORSAIR 2GB x2 DDR3-1600(9-9-9-24-1T)
硬 盤
Seagate 7200.12 1TB
電 源
安耐美金魔族87+
軟體系統配置
作業系統
Windows 7 Ultimate 64Bit
DirectX
11.0
顯示驅動
NVIDIA Forceware 260.89 WHQL
ATI Catalyst 10.10 WHQL
此次測試平臺選擇了AMD最高端的六核心處理器,搭配最新的890FX晶片組,與Radeon HD6000/5000系列可以組成傳說中的3A平臺。雖然看起來很高端,但其實價格並不算貴,比Intel平臺的性價比要高很多。
AMD此次發布的新品HD6870和HD6850,我們自然會拿它與自家上代產品HD5870和HD5850進行對比。至於N卡方面,則選擇了價位相近的GTX460 1GB和GTX470進行對比,總計六款定位中高端的顯卡。
所有參測顯卡都使用NVIDIA和AMD雙方的公版規格和公版頻率,這樣測得的性能和功耗發熱數據最有參考價值。
第五章/第二節 DX9C理論:《3DMark06》
軟體介紹:3DMark06作為DX9C權威的理論測試工具,包括了兩個SM2.0測試和兩個SM3.0測試場景,基本上達到了DX9C的畫面最高境界。雖然當今顯卡已全面進入了DX11時代,但考慮到至今仍有不少新遊戲依然採用DX9C引擎,加入3DMark06的測試結果對於很多主流遊戲都有參考價值的。
畫面設置:如今3DMark06已經難不倒高端顯卡了,高端顯卡在3DMark06中難分高下,所以我們只能最大程度的提高它對系統的要求,比如說提高解析度開啟抗鋸齒等。所以我們選定了在1920x1200主流解析度開啟最高的8AA16AF模式下,測得其SM2.0和SM3.0兩項成績供大家參考。
可以看到,HD6870的性能剛好在HD5870和HD5850之間,並沒有超越上代單芯旗艦。事實上通過其核心規格就可以大致了解到HD6870的性能是不可能達到HD5870的水平的,能夠勝過HD5850已經很不容易了。
HD6850自然也不敵HD5850,但是相比同價位的GTX460 1GB,還是有一定的優勢。
HD5870與GTX470之間的性能對比,也同樣值得關注。接下來在熱門DX9C遊戲中,我們看看性能表現是否與3DMark06一致?
第五章/第三節 DX9C遊戲:《使命召喚6:現代戰爭2》
遊戲介紹:作為《使命召喚》系列的第六部作品,在《現代戰爭2》中,將《使命召喚4:現代戰爭》劇情延續,俄羅斯又再次陷入政治上的紛擾不安。伏拉米爾.馬卡洛夫這位和伊姆蘭.扎哈恐怖組織有關連的粗暴領袖,策劃了一連串即將危及世界安全的陰謀。
相關評測:經典再度回歸!全特效爽玩[現代戰爭2]
畫面設置:《現代戰爭2》遊戲中的畫質進階設定顯得比較簡單,在這裡我們能看到常見的陰影開關、各種畫面細節、材質填充模式等。COD6雖然引擎比較老,但經過常年累月的優化,爆炸、煙霧、火焰效果都不輸給DX10遊戲,要求也並不低。遊戲內置AA最高4x,所以並沒有測試8xAA時的性能。
測試方法:遊戲沒有提供Benchmark,測試時筆者選用了一段固定的場景,期間會有爆炸、大樓倒塌、灰塵瀰漫等複雜的場景,通過Fraps記錄整個過程的平均FPS和最低FPS。
★ 1920x1200解析度,抗鋸齒4x
COD6中的表現,與3DMark06比較類似,HD6870略勝HD5850,HD6850小勝GTX460。雖然A卡的平均性能要強於N卡,但最小FPS方面N卡還具有一定的優勢。此次測試我們不僅加入了最小幀,而且還將測試過程中的FPS波動曲線繪製出來,供大家參考:
可以看出,在測試前半分鐘,由於出現了複雜的爆炸場景和大量的煙霧效果,幾款顯卡的FPS損失都比較嚴重,還好大都保證30幀以上的流暢速度。
而在後半分鐘,場景比較穩定時,即便是最弱的GTX460發揮也很不錯,他們的實力差距完全的呈現在了大家面前。
第五章/第四節 DX9C遊戲:《星際爭霸2:自由之翼》
相關評測:破解如此簡單!教你單機爽玩《星際2》
遊戲介紹:萬眾期待的暴雪神作《星際爭霸》,在10年之後終於迎來的3D版本,目前暴雪已經正式開放了《星際爭霸2:自由之翼》的Beta測試。雖然該遊戲並不支持時下流行的DX10、10.1甚至DX11,但暴雪憑藉成熟的DX9C技術,也將畫面做的非常完美,大量HDR及SSAO特效的應用導致要求也比較高。
畫面設置:所有特效全開最高,解析度使用常見的1920x1200。值得一提的是,星際2雖然沒有抗鋸齒模式,但可以在顯卡驅動中強開,畫質會有所改善。因此測試時我們打開了4AA16AF模式。
測試方法:從戰網上下載一個1V1單挑錄像,通過錄像回放模式播放一段激烈的戰鬥場面,通過Fraps記錄平均FPS和最小FPS。
★ 1920x1200解析度,超高畫質,4AA16AF
通過此前大量的測試證明,星際2對顯卡的要求並不算高,高端顯卡在運行星際2時出現了性能過剩的情況,FPS無法進一步提升的瓶頸在於CPU,而非顯卡。因此我們可以看到六款顯卡的性能表現並沒有拉開差距。
通過實施FPS波動曲線來看,幾款顯卡都不是很穩定,性能也沒有多少差距,流暢運行星際2不成問題。
第五章/第五節 DX9C遊戲:《街頭霸王IV》
遊戲介紹:CAPCOM公司於1987年推出的大型電玩機臺格鬥遊戲《街頭霸王》,堪稱目前格鬥類遊戲的始祖。經過了20多年的不斷演化之後,如今的PC版《街頭霸王4》不僅在畫面上走向了全新方向,而且加入了各種新系統,試圖讓傳統2D格鬥遊戲得到重生。
畫面設置:街霸4 PC版和遊戲機版相比,除了支持高解析度輸出之外,還為玩家提供了畫面渲染風格選擇的功能,除與家用機版一樣的「普通」模式外,還有「水彩」、「海報」和「菸灰墨」這三種追加的渲染風格,帶給完全全新的視覺體驗。
測試方法:測試時使用遊戲自帶Benchmark。由於遊戲要求較低,因此直接開啟最高的8xMSAA+16AF模式。
★ 1920x1200解析度,抗鋸齒8x,各項異性過濾16x
這款引擎老舊、畫面風格簡單的遊戲已經難不倒當今中高端顯卡了,隨便都能跑出100幀以上的成績,此時討論性能高低、是否流暢已經沒什麼意義了。
第五章/第六節 DX9C遊戲:《黑手黨2》
相關評測:285隻配做物理卡?[黑手黨2]全面評測
遊戲介紹:《黑手黨2》(Mafia II)將帶領玩家進入1940年至1950年虛構的地下世界,就像好萊塢電影般的遊戲世界,玩家可在擬真的城市中冒險。在1940年代的城鎮中,居民如同往常過著平靜的生活,幫人擦鞋、賣報紙,而路邊偶爾會出現黑幫份子。
畫面設置:這是一款支持PhysX GPU物理加速的最新遊戲,但依然使用了DX9C引擎,因此畫面本身並不出彩,但大量的爆炸、煙霧、破碎、衣料等物理效果還是很不錯的。
測試方法:遊戲自帶Benchmark,內置的抗鋸齒並不知道是多少倍數,分為不開PhysX和High兩種模式進行測試。
★ 1920x1200解析度,不開PhysX
其實在關閉PhysX的情況下,遊戲中依然有一些物理效果通過CPU演算,此時顯卡的性能等級分布與3DMark06相類似,6870略勝5850、6850略勝GTX460。
★ 1920x1200解析度,PhysX High
開啟PhysX之後,不支持GPU加速的A卡瓶頸卡在CPU方面,FPS直線下跌到10幀以下,完全無法流暢運行,性能也無法分出高下。而GTX460算是勉強流暢吧,能保證25幀左右的成績。
第五章/第七節 DX10理論:《3DMark Vantage》
遊戲介紹:3DMark Vantage所使用的全新引擎在DX10特效方面和《孤島危機》不相上下,但3DMark不是遊戲,它不用考慮場景運行流暢度的問題,因此Vantage在特效的使用方面比Crysis更加大膽,「濫用」各種消耗資源的特效導致Vantage對顯卡的要求空前高漲,號稱「顯卡危機」的Crysis也不得不甘拜下風。
畫面設置:3DMark Vantage中直接內置了四種模式,分別為Extreme(旗艦級)、High(高端級)、Performance(性能級)和Entry(入門級),只有在這四種模式下才能跑出總分,如果自定義模式就只能得到子項目分數了。我們為這次的頂級卡對決選擇了最高的Extreme模式,它其實就是最高畫質1920x1200解析度再加上4AA16AF模式。
測試方法:N卡支持PhysX,在CPU測試子項中成績會翻幾倍,最終總成績會提高一些,但並不會影響GPU測試子項的成績,因此在測試中保持默認驅動設置,PhysX是開啟的。
3DMark Vantage比3DMark06更加偏重於像素著色器的性能,因此流處理器數量較少的HD6870和HD6850並不佔優勢,HD6870隻領先HD5850一點點,而HD6850落後GTX460比較多。
第五章/第八節 DX10遊戲:《孤島危機:彈頭》
遊戲介紹:Crysis(孤島危機)無疑是DX11出現之前對電腦配置要求最高的PC遊戲大作。Crysis的遊戲畫面達到了當前PC系統所能承受的極限,超越了次世代平臺和之前所有的PC遊戲。Crysis還有個資料片Warhead,使用了相同的引擎,只是多了一個關卡,因此我們還是使用原版做測試。
畫面設置:Crysis只有在最高的VeryHigh模式下才是DX10效果,但此前所有高端顯卡都只能在低解析度下才敢開啟DX10模式,如今的DX11顯卡終於有能力單卡特效全開流暢運行。我們直上1920x1200高解析度,開啟4AA和8xAA兩種模式進行測試。
測試方法:Crysis內置了CPU和GPU兩個測試程序,我們使用GPU測試程序,這個程序會自動切換地圖內的全島風景,得到穩定的平均FPS值。
★ 1920x1200解析度,抗鋸齒4x
★ 1920x1200解析度,抗鋸齒8x
Crysis大量使用了高精度紋理貼圖,因此紋理單元數量較少的N卡非常吃虧,HD6850的性能都達到了GTX470的級別。這款重量級的DX10大作,讓N卡很沒面子。
由於Crysis自帶的Benchmark並沒有按時間軸進行測試,獲得的實時FPS波動曲線沒有可比性,因此這款遊戲並沒有提供FPS曲線供大家參考。
第五章/第九節 DX10遊戲:《衝突世界:蘇聯進攻》
遊戲介紹:《衝突世界》將帶領玩家返回著名的冷戰時期,玩家每一個決定均影響遊戲中人物和情節。可於遊戲中感受不一樣的團隊精神,與隊友於陰森恐怖的戰場上一同作戰。《蘇聯進攻》是其最新的資料片,收錄全新角色、扮演蘇聯軍隊、10套新影片和全新多人聯機地圖等等。
畫面設置:《衝突世界》是首批DX10遊戲之一,採用了自行研發的MassTech引擎,支持多種當前的主流顯示特效,如容積雲,景深效果,軟陰影等,光照系統也表現出色,尤其是半透明的容積雲特效營造出了十分逼真的戶外場景,物理加速結合體積光照渲染出了最逼真的爆炸效果。
測試方法:內置Benchmark是一段非常華麗的過場動畫作為測試程序,最終得出最大、最小和平均FPS,測試結果非常精確。WIC最高支持4AA,因此我們只測試1920 4AA16AF模式。
★ 1920x1200解析度,抗鋸齒4x,各項異性過濾16x
HD6870與HD5850、GTX470幾乎完全相同,但都不如HD5870,1600個流處理器的威力不可忽視。HD6850隻是小勝GTX460,由於WIC的部分場景特別複雜,因此幾款顯卡的最小幀都很低。
通過實時FPS波動曲線可以看出,流處理器較少、頻率較低的HD6850在最小幀方面的表現確實不如GTX460,但平均FPS要高於它。
第五章/第十節 DX10.1遊戲:《孤島驚魂2》
遊戲介紹:自《孤島驚魂》系列的版權被UBI購買之後,該公司蒙特婁分部就已經開始著手開發新作,本作不但開發工作從Crytek轉交給UBI,而且遊戲的故事背景也與前作毫無關係,遊戲的圖形和物理引擎由UBI方面完全重新製作。
畫面設置:藉助於蒙特婁工作室開發的全新引擎,遊戲中將表現出即時的天氣與空氣效果,所有物體也都因為全新的物理引擎,而顯得更加真實。你甚至可以在遊戲中看到一處火焰逐漸蔓延,從而將整個草場燒光!而且首次對DX10.1提供支持,雖然我們很難看到。
測試方法:遊戲自帶Benchmark工具。
★ 解析度1920x1200,抗鋸齒4x
★ 解析度1920x1200,抗鋸齒8x
FarCry2中N卡的實力不凡,GTX460達到了HD5850的水準,略輸於HD6870,而HD6850則墊底,畢竟流處理器和頻率縮水都比較多。
第五章/第十一節 DX10.1遊戲:《鷹擊長空》
遊戲介紹:《鷹擊長空》由Ubisoft旗下的Bucharest Studio工作室所研發製作而成,以湯姆克蘭西最擅長的近現代國際衝突為背景,加上現代化的軍事武器,和五角大廈不願證實的開發中的先進武器,交織出最激烈的高科技攻防戰。而《鷹擊長空》也脫離前面幾項作品的框架,將戰爭從地面拉拔到空中,享受廣大無界限的戰鬥空間。
畫面設置:《鷹擊長空》直接內置了對DX10和DX10.1的支持,它會自動檢測顯卡最高能支持的級別。通過此前的測試來看DX10.1並不會讓畫質變得更高,但的確能夠讓遊戲跑得更快。我們使用1920解析度,4AA和8AA兩種模式進行測試。
測試方法:遊戲自帶Benchmark,A/N雙方都開啟DX10.1模式。
★ 解析度1920x1200,抗鋸齒4x
★ 解析度1920x1200,抗鋸齒8x
這次性能表現又反過來了,在前期HD6850與GTX460的性能不相上下,但在測試場景後半部分激烈的空戰中,GTX460性能波動較大,而A卡的整體表現則較為穩定,最終勝出。
第五章/第十二節 DX11理論測試:《Heaven Benchmark 2.1》
遊戲介紹:Unigine Engine率先發布了首款DX11測試/演示程序——Heaven Benchmark,其中大量運用了DX11新增的技術和指令,看來在新版3DMark面世之前,Heaven將會是DX11性能測試的最佳選擇。
畫面設置:2.1版本進一步強化了Tessellation技術的應用,細分精度更高,畫面更上一層樓,測試時所有特效全開最高,包括Extreme級別的Tessellation。
測試方法:自帶Benchmark。
★ 解析度1920x1200,抗鋸齒4x,各項異性過濾16x
★ 解析度1920x1200,抗鋸齒8x,各項異性過濾16x
Heaven 2.0的測試過程比較漫長,總共有多達26個場景(視角),因此實時FPS波動曲線比較密集。最終性能差異也很明顯,Tessellation性能偏弱的A卡整體都不如N卡。
但值得一提的是,HD6870的性能居然超越了HD5870,與GTX460差不多;HD6850的性能也達到了HD5850的水平。這說明新一代HD6000系列的確對於Tessellation性能進行了改良,在曲面細分負載特別重的Heaven 2.1當中,HD6870並沒有輸給GTX460,要知道GTX460擁有多達7個曲面細分單元,而HD6870隻有1個,能夠在N卡的強項中打成平手已經很不容易了。
第五章/第十三節 DX11演示Demo:《石巨人》
遊戲介紹:遊戲引擎開發商BitSquid與遊戲開發商Fatshark近日聯合公布了一個展示DX11強大技術的DEMO。這個名為《StoneGiant》(石巨人)的DEMO,可以讓玩家來測試自己PC顯卡的DX11性能。BitSquid Tech即將提供PC平臺的引擎,並且大概在今年第三季度將提供PS3和Xbox 360等其他平臺的引擎。
畫面設置:StoneGiant是一款技術演示Demo,畫面做的非常精美,進入之後可以選擇開啟關閉Tessellation以及DOF(DX11級別景深)進行測試,這兩項技術都十分消耗資源,尤其是同時打開時。其中Tessellation技術對畫質的改善最為明顯,而DOF如果不細看則不容易察覺,因此測試時默認開啟Tessellation、分別打開和關閉DOF進行兩次測試。
測試方法:遊戲自帶Benchmark。
★ 1920x1200解析度,不開景深
★ 1920x1200解析度,開啟景深
比起Heaven Benchmark,石巨人當中使用了更多的曲面細分技術,因為這款Demo本身就是NVIDIA主推的,最終A卡表示壓力非常大,就連經過改進Tessellator單元的HD6870/6850也敗下陣來,都不如GTX460。
不過,無論「天堂」還是「石巨人」,都走的是極端路線,目前所有9款DX11遊戲都沒有使用如此苛刻的曲面細分特效,雖然A卡在Tessellation技術方面依然落後於N卡,但無傷大雅,目前以及今後的DX11遊戲依然不會走到如此極端的地步。
第五章/第十四節 DX11遊戲:《BattleForge》
相關評測:HD5870不再寂寞!首款DX11遊戲大測試
遊戲介紹:《BattleForge》是EA旗下德國Phenomic遊戲製作室研發的全新即時戰略網路遊戲。在《BattleForge》中,玩家依靠收集、交易卡牌來建立龐大的軍隊。通過在線贏取、交易和購買卡牌來組成你強大的陣容,混合搭配不同屬性的卡牌來和朋友進行在線戰鬥,或是在大規模的在線戰役中取得勝利。
畫面設置:從技術角度來講,這款遊戲也非常值得關注,其畫面堪稱網遊頂尖之作,率先提供了對DX10.1技術和屏幕空間環境光遮蔽(SSAO)特效的支持,還針對多核心處理器進行了優化。現在又第一時間對DX11加入了支持,加入了HDAO和DirectCompute,測試時自然所有特效全開最高。
測試方法:《BattleForge》雖然是款網遊,但遊戲自帶了Benchmark,這給評測帶來了很多便利。Benchmark可以測出最大/最小/平均FPS三個數值,筆者連跑三遍Benchmark得到最穩定的成績,保留了最有參考價值和的平均FPS和最小FPS供大家參考。
★ 解析度1920x1200,抗鋸齒4x,各項異性過濾16x
★ 解析度1920x1200,抗鋸齒8x,各項異性過濾16x
4AA模式下,HD6850的性能與GTX460相同,但開到8AA之後被反超,新一代N卡的抗鋸齒性能還是很強的。HD6870依然只是小勝HD5850,畢竟這款DX11遊戲並沒有太多新的DX11特性。
第五章/第十五節 DX11遊戲:《科林麥克雷:塵埃2》
相關評測:DX11代表作!20款主流顯卡決戰[DiRT2]
遊戲介紹:《科林麥克雷》系列遊戲是為紀念去世的英國拉力賽車手科林·麥克雷(Colin McRae)而製作的,因此在遊戲過程中不難見到許多麥克雷過往的身影。與一年一款的極品系列賽車遊戲不同,DiRT2距離前作已經兩年之久,目前《科林麥克雷:塵埃2》主機版早已上市,幾乎登陸所有的主機和掌機平臺、好評如潮,而PC版由於支持DX11的緣故,所以被延期數月。
畫面設置:DIRT2堪稱DX11遊戲代表作,DX11的五大關鍵特性在這款遊戲中都有體現,但卻沒有得到大範圍的應用,都是點到為止。比如Tessellation主要體現在水窪和旗幟上,而賽車過程中也就那麼幾處採用了該技術,因此這款DX11的要求並不高,特效全開的話中端顯卡都能跑動。
測試方法:遊戲自帶Benchmark程序,會自動跑完一個固定的賽道,非常接近於真正玩遊戲的模式,最後得出平均FPS和最小FPS。
★ 1920x1200解析度,抗鋸齒4x
★ 1920x1200解析度,抗鋸齒8x
在《塵埃2》中,GTX460 4xAA模式下性能較好,可在8xAA模式下性能損失較多,但依然能勝過HD6850,HD6870還是小勝HD5850。
好在塵埃2的要求不是很高,幾款顯卡特效全開最高都能流暢自如的運行。
第五章/第十六節 DX11遊戲:《潛行者:普裡皮亞季的召喚》
相關評測:感受DX11的魅力![STALKER]資料片試玩
遊戲介紹:《潛行者》系列遊戲現在已經出到第三部了,其中第二部《晴空》是原作《陰影》的前傳,而第三部《普裡皮亞季的呼喚》則是原作《陰影》的後傳,講述了在變異區中心被發現後,烏克蘭政府決定舉行代號「航道」的大規模軍事行動,目的則是控制變異區的科技,玩家的冒險也就此展開。
畫面設置:此前《潛行者:晴空》已經率先支持DX10.1,主要優化了抗鋸齒算法、陰影渲染和效率,新版的資料片則首次加入支持DX11,通過Tessellation技術大幅加強了模型細節、紋理和光影,而且通過DirectCompute 11技術改進了算法,提升遊戲性能。測試時將包括透明抗鋸齒在內的所有特效全開最高,考驗高端顯卡在最高畫質下的性能表現。
測試方法:使用官方Benchmark包進行測試,遊戲沒有提供更高的AA級別,因此只測試4AA模式。
★ 解析度1920x1200,抗鋸齒4x
HD6870隻比HD5850強一點,也比GTX470強一點點,但與HD5870的差距很大。HD6850也比GTX460強一點點,可以說是旗鼓相當了。
第五章/第十七節 DX11遊戲:《異型大戰鐵血戰士》
相關評測:年度DX11大作!異形大戰鐵血戰士測試
遊戲介紹:《Aliens vs. Predator》同時登陸PC、X360和PS3,其中PC版因為支持DX11裡的細分曲面(Tessellation)、高清環境光遮蔽(HDAO)、計算著色器後期處理、真實陰影等技術而備受關注,是AMD大力推行的遊戲之一,但是這樣的主題難免讓本作有很多不和諧的地方,暴力血腥場面必然不會少!發行商世嘉在2009年11月就曾明志,表示不會為了通過審查而放棄電子娛樂產品發行商的責任,因為遊戲要維持「異形大戰鐵血戰士」這一中心主題,無論畫面、玩法還是故事線都不能偏離。
畫面設置:AVP原始版本並不支持AA,但升級至1.1版本之後,MSAA選項出現在了DX11增強特效當中,當然還支持Tessellation、HDAO、DirectCompute等招牌。該遊戲要求不算太高,所以筆者直接將特效調至最高進行測試。
測試方法:遊戲自帶Benchmark
★ 1920x1200解析度,抗鋸齒4x,各項異性過濾16x
HD6870憑藉較高的頻率,性能上表現不賴,超過了自家的HD5850和對手的GTX470。而HD6850由於頻率較低,性能只能和GTX460處在同一級別。
第五章/第十八節 DX11遊戲:《戰地:叛逆聯隊2》
遊戲介紹:《戰地:叛逆連隊2》(Battlefield: Bad Company 2),是EA DICE開發的一款第一人稱射擊遊戲。開發商EA已經於本月2日正式同步發售了Xbox 360、PS3、PC版。該遊戲是EA DICE開發的第9款「戰地」系列作品,也是《戰地:叛逆連隊》的直接續作,在繼承前作特性的基礎上,強化了多人聯機載具對戰和團隊合作元素的設定。遊戲使用加強版的寒霜引擎,加入了建築物框架破壞和物體分塊破壞的支持。
畫面設置:《叛逆聯隊2》雖然是款DX11遊戲,霜寒引擎也是備受期待的DX11引擎,曾被ATI用來做Tessellation的技術展示。不過最新版本的對DX11的支持非常有限,僅僅是採用新指令集渲染HBAO特效而已,遊戲會自動偵測顯卡的DX級別來選擇渲染模式。
測試方法:遊戲不帶Benchmark,筆者選取了單人任務模式下的一段無需手動幹涉的過場動畫進行測試,其中包括大量激烈的轟炸爆破激戰場面,完全可以反映真實的遊戲性能。
★ 1920x1200解析度,抗鋸齒4x,各項異性過濾16x
★ 1920x1200解析度,抗鋸齒8x,各項異性過濾16x
這款DX11遊戲中,各款顯卡的性能排列與AVP區別不大,HD6850和GTX460在4AA模式下性能持平,8AA模式下HD6850稍遜一籌,看來HD6850和GTX460的性能表現十分接近,他們在所有遊戲中的成績都非常值得關注,畢竟GTX460是NVIDIA的當紅明星,而HD6850則是AMD未來的中端主力。
第五章/第十九節 DX11遊戲:《地鐵2033》
相關文章:DX11《地鐵2033》畫質、顯卡性能對比
遊戲介紹:《地鐵2033》(Metro 2033)是俄羅斯工作室4A Games開發的一款新作,也是DX11遊戲的新成員。該遊戲的核心引擎是號稱自主全新研發的4A Engine,支持當今幾乎所有畫質技術,比如高解析度紋理、GPU PhysX物理加速、硬體曲面細分、形態學抗鋸齒(MLAA)、並行計算景深、屏幕環境光遮蔽(SSAO)、次表面散射、視差貼圖、物體動態模糊等等。
畫面設置:《地鐵2033》雖然支持PhysX,但對CPU軟體加速支持的也很好,因此使用A卡玩遊戲時並不會因PhysX效果而拖累性能。該遊戲由於加入了太多的尖端技術導致要求非常BT。
測試方法:選用第三方Benchmark程序,這是一小段地鐵隧道中的戰鬥場景,場面複雜戰鬥激烈,對顯卡提出了嚴峻考驗。
★ 1920x1200解析度,開啟自適應抗鋸齒(AAA),各項異性過濾16x
雖然沒有開啟MSAA,但DOF(景深)的加入也讓頂級顯卡們不堪重負了,HD6870能達到和HD5870/GTX470一樣的級別,算是個奇蹟。
★ 1920x1200解析度,抗鋸齒4x,各項異性過濾16x
一旦開啟4xMSAA之後,A卡性能下降很多,尤其是規格較低的HD6850,而N卡效率較高。
不過所有的顯卡都沒能超過20幀,都卡的不行,所以這裡的測試成績都是毫無意義的,只能作為參考。
第五章/第二十節 DX11遊戲:《失落的星球2》
遊戲介紹:《失落的星球2》的遊戲舞臺是前作故事發生後十幾年之後經過溫暖化改變的EDN-3rd,這裡將新增叢林等新場景,主人公也並非前作那樣為一人,而是以「雪賊」們不同的視點展開故事。
畫面設置:與前作相同,《失落的星球2》採用CAPCOM公司原創引擎MT Framework的最新版VER.2.0進行開發,遊戲世界的表現將更加細緻和美麗。而不僅僅是畫面上的進化,本作將會在前作玩家要求基礎上追加大量全新要素,新場景、新角色、新武器等自不必說,角色的動作也比前作更加豐富多彩。
測試方法:遊戲自帶Benchmark,選擇B場景的BOSS戰,非常激烈過癮。
★ 1920x1200解析度,抗鋸齒4x,各項異性過濾16x
★ 1920x1200解析度,抗鋸齒8x,各項異性過濾16x
失落的星球一代是首款DX10遊戲,是由NVIDIA主導開發而來的,二代是在一代引擎的基礎上改進而來,由於採用非常複雜的指令,因此非常適合於N卡的MIMD引擎,而A卡SIMD引擎的執行效率會比較低。
這款遊戲對N卡的優化支持非常到位,可以看出GTX460和GTX470的性能都相當不錯,遠超同級A卡。
但值得一提的是,在這款遊戲中,HD6870的性能小勝HD5870,出現這種情況的原因只有一種——那就是雙超線程分配處理器發揮作用了,它使得HD6870比HD5870擁有更高的執行效率。
第五章/第二十一節 DX11遊戲:《文明5》
相關評測:首款DX11策略遊戲《文明5》詳細評測
遊戲介紹:該遊戲的主體內容正如遊戲名稱一樣,描述了人類文明誕生後的發展歷程,玩家將從公元前4000年開始,一直將一個種族發展到21世紀甚至未來,發展歷程中緊密相關的是經濟、文化、科技、政治等因素,你將親身感受歷史中各種各樣的事件。最終建立起一個王朝,遊戲最終勝利的方法也多種多樣,包括軍事徵服、文化統一、外交等多種手段。不僅遊戲本身樂趣十足,還能充分了解人類文明發展的歷程。
畫面設置:文明5雖然支持DX11,但對顯卡的要求不算高,所有的場景都是靜態畫面,即便FPS很低也不影響遊戲感。只是作為一款回合制遊戲,在進行演算的過程中非常消耗CPU資源。
測試方法:我們發現在地圖全開模式,切換到最高視覺時,最消耗顯卡資源,因此我們選擇了在這種模式下進行測試。
雖然FPS都不足25幀,其實這種最高視覺俯瞰的模式走的是極端,稍微放大一下FPS就會成倍的提高。HD6870的表現還是不錯的,但HD6850性能偏低。
第六章 附加測試項目與成績匯總
第六章/第一節 附加測試:顯卡功耗
我們的功耗測試方法是直接統計整套平臺的總功耗,既簡單、又直觀。測試儀器為微型電力監測儀,它通過實時監控輸入電源的電壓和電流計算出當前的功率,這樣得到的數值就是包括CPU、主板、內存、硬碟、顯卡、電源以及線路損耗在內的主機總功率(不包括顯示器)。
待機為windows7桌面下獲得的最小值;滿載是以1920 8AA模式運行Furmark時的最大值,Furmark能夠讓顯卡穩定的以100%滿負載模式運行,測得的功耗值比一般的遊戲要高一些。
HD6870與HD6850的待機功耗都是116W,均小於HD5870和HD5850,可見AMD在空閒功耗控制方面又有了一定的進步,但比起GTX460還是要稍高6瓦,具體原因筆者將在下頁進行分析。
而滿載功耗方面,HD6850控制的最為出色,比GTX460低了37瓦,而這兩款顯卡的性能是十分接近的。HD6870的性能要遠勝過GTX460,但它的功耗只比HD5850高6W,表現非常完美。
GTX470則是個電老虎,無論待機還是滿載都遙遙領先於其他顯卡,這款產品雖然性能接近於HD5870,但功耗發熱噪音都讓人難以接受。
第六章/第二節 附加測試:待機頻率/溫度/電壓對比
HD6870/HD6850的功耗相當不錯,那麼發熱和噪音方面如何呢?我們藉助一些監控工具來看看。測試環境為開放式平臺,中央空調保證室溫穩定在25度左右:
★ HD6870待機頻率100/300MHz,核心電壓0.945V,核心溫度43°
註:目前GPU-Z對HD6000系列的顯存頻率監控不準確,實際頻率應該以催化器驅動中的為準,HD6000系列待機時的顯存頻率為300MHz,與HD5000系列相同。
★ HD5850待機頻率157/300MHz,核心電壓0.95V,核心溫度38°
★ GTX460待機頻率50.6/67.5/101MHz,核心電壓0.875V,核心溫度33°
現在我們就可以知道為什麼HD6870/6850的待機功耗要低於HD5870/5850,但還是比GTX460稍高一點了。因為GTX460可以將核心頻率和電壓降到更低。
由於手頭的HD6850顯卡並未使用公版散熱器,XFX送測的產品採用了開放式散熱風扇,由於是樣卡的關係風扇轉速較高,並沒有對比參考價值。
第六章/第三節 附加測試:滿載溫度/轉速對比
再來看看滿載拷機測試,使用Furmark極端模式,看看最終穩定的溫度是多少,此時的風扇轉速如何:
★ HD6870滿載:核心電壓1.172V,核心溫度79°,風扇轉速2050RPM
★ HD5850滿載:核心電壓1.0875V,核心溫度84°,風扇轉速2116RPM
★ GTX460滿載:核心電壓1.0V,核心溫度68°,風扇轉速2070RPM
可以看出,在風扇轉速差不多的情況下,HD6870雖然頻率和電壓都比HD5850高,但溫度要低一些,這就是電晶體數較少的好處。
GTX460的滿載功耗雖然高過HD6870和HD5850,但GTX460的溫度明顯要比HD6870和HD6850更低,而他們的風扇都是2000轉左右,由此可見GTX460公版的開放式散熱系統要比AMD公版的封閉式渦輪側吹系統效率高很多。
第六章/第四節 成績匯總與PK:HD6870 PK GTX460
AMD新秀HD6870對比NVIDIA當紅明星GTX460 1GB完全是壓倒性的性能優勢,在幾乎所有的遊戲中都保持較大的領先幅度,只在兩款DX11理論Benchmark和PhysX遊戲中告負。
可能有些人會說,HD6870無論核心頻率還是顯存頻率,都要比GTX460高不少,這樣對比會否有失公允?如果您有這個疑慮的話,那麼不妨看看表格最下放的功耗測試,HD6870比GTX460 1GB還要低9瓦。
這就意味著,A卡無論單位功耗下的性能、還是單位電晶體的性能,都已經完勝N卡了。
第六章/第五節 成績匯總與PK:HD6850 PK GTX460
HD6850無論核心流處理器數量、核心頻率還是顯存頻率,都比HD6870低了不少,因此性能損失也比較嚴重,與GTX460 1GB相比的話,還是輸多勝少。
不過仔細看來,HD6850輸得比較慘的地方,主要是在兩款DX11 Benchmark以及地鐵2033開啟4AA模式下,此時的FPS本身非常低,參考意義並不大。其他遊戲中兩款顯卡互有勝負,輸贏幅度都不是很大。
總體來看,HD6850是略負於GTX460 1GB,通過百分比來看肯定要比GTX460 768MB強不少。當然HD6850最大的優勢就在功耗以及功能方面,具體這款產品性價比如何,就要看AMD如何定位了。
第六章/第六節 成績匯總與PK:HD6870 PK GTX470
整理來看,HD6870相比GTX470是輸多勝少,贏的項目優勢不明顯,而輸的項目反而比較大。不過HD6870的劣勢項目主要集中在兩款DX11 Benchmark上面,其他遊戲中的性能差距不是很大。綜合下來HD6870僅僅是落後了不到4%而已。
HD6870落後於GTX470的幅度不是很多,兩者在功耗發熱方面的差距,那是一個天上一個地下。再考慮到兩款顯卡的售價,那麼誰輸誰贏就很清楚了。
第六章/第七節 成績匯總與PK:HD6870 CrossFire交火效率
HD6870其實是AMD定位中端的顯卡,所以我們看到其交火接口也精簡為1個,這樣顯卡最多可以組建雙路CrossFire,無法像HD5870/5850那樣組建三路和四路交火。
那麼其雙路交火效率怎麼樣呢?我們來檢驗一下。測試平臺保持不變,新一代的890FX晶片組最多可以支持四路交火,如果雙路系統的話還能保證兩塊顯卡都是PCI-E 2.0 X16的全速接口,保證最高效能。
可以看出,在幾款要求十分苛刻的遊戲當中,雙HD6870交火系統相比單卡的性能提升高達90%以上,這說明AMD交火驅動已經做得非常完善了,3A平臺也相當給力。
不過,在部分要求不高的老遊戲、或者是CPU瓶頸效應比較嚴重的遊戲中,典型的比如街霸4、文明5、星際2等,雙卡性能提升幅度並不明顯。正是這些遊戲拖累了交火的整體性能提升幅度。即便如此,交火系統的整體性能提升幅度已經達到了60%以上,相當強大!
由於產品線的進一步細分,幾款中高端顯卡之間的性能差距變得越來越小,通過本文中的大量測試來看,HD6850的性能直逼GTX460 1GB,HD6870的性能小勝HD5850,與GTX470不相上下。
HD6870的性能遠勝過GTX460 1GB,而HD6850的性能也要比GTX460 768MB強很多。HD6870/6850問世之後,對於NVIDIA的唯一給力產品GTX460形成了有力的夾擊,讓GTX460的輝煌僅僅延續了三個月而已。
雖然HD6870沒有成為和上代HD5870一樣的頂級單卡,但其性能表現還是可圈可點的,架構方面的優化改進讓HD6870在部分特殊的遊戲和Benchmark當中具有了挑戰HD5870的實力。而更低的功耗發熱、更便宜的售價,使得性能與HD6870相近的GTX470這款電老虎變得毫無選購價值。
HD6850略負於GTX460 1GB,但相比GTX460 768MB有著壓倒性的優勢
HD6850的定位也十分精準,其性能只是略負於GTX460 1GB,因此AMD的定價也是要比GTX460 1GB便宜100元,但如果我們把功耗、功能等因素都考慮進去的話,顯然HD6850顯然更具競爭力。
或許我們不應該停留在單純對比性能與價格這種初級階段了,在本文的最後,我們來談談GPU效能——即單位核心面積所能實現的性能,或者單位功耗所能實現的性能。
AMD在GPU變得越來越龐大的時候非常謹慎,因此不惜重新設計一代產品來縮小GPU核心。Barts核心面積只有230mm2,而GF104則高達367mm2,核心面積的大小就意味著這顆GPU的製造成本將會有多高。Barts的成本遠低於GF104,但性能卻更強,毫無疑問AMD單位核心面積所實現的性能要比NVIDIA高出不止一級。
玩家們可能並不太關心GPU的製造成本,只要顯卡賣得便宜就好,至於誰的利潤更加豐厚,這是投資者和分析師應該關心的內容。但玩家們應該會比較在意顯卡的功耗,HD6870的滿載功耗要略低於GTX460,但性能卻要強不少,在單位功耗所實現的性能方面,AMD又勝一局。
6800表現不俗,6900更值得期待
造成AMD GPU效能高於NVIDIA的根本原因,就是它們的核心架構。AMD曾經背負效率低下罵名的SIMD架構,終於笑到了最後。憑藉超大規模的流處理器、以及改進的雙超線程分配處理器、HD6000的效率比起HD5000又有了明顯的提升。
而NVIDIA方面MIMD架構想要擴充流處理器的話,需要耗費更多的電晶體,由此導致NVIDIA的GPU核心面積要比AMD同級別產品大不少,而大核心除了成本較高之外,還得面對良品率較低、功耗較大的負面影響。
目前NVIDIA的GTX400全系列產品,要麼是屏蔽了流處理器、要麼就是屏蔽了顯存控制器、甚至兩者都屏蔽,總之沒有一款是完整的核心。我們毫不懷疑完整的GF100、GF104、GF106核心將會擁有更強勁的性能,但隨之而來的就是更高的功耗與發熱。
AMD能夠在製造工藝受限的情況下,進一步控制GPU製造成本,在降低功耗與發熱的同時還能提升性能、增強功能,這才是玩家們真正需要的顯卡!■<