在ATI正式發布最新的R420顯示核心之前,編輯們對這顆神秘晶片的架構衍生出了蠻多的猜想。隨著5月18日R420顯示核心以及採用這一核心的X800系列顯卡在京正式發布,當具體規格細節展現在人們眼前後,正應了那句經典的臺詞:「就素那浮雲……」
相對於4月先一步推出的NV40顯示核心以及GeForce 6系列顯示卡,ATI的產品在發布上稍許晚了些日子,就在這期間也因此難免引起了人們的各種猜疑,相對R9800XT發布時的場景,甚至有人推測莫非這次R420技不如人要黃了?
這些亂七八糟的猜測,歸根到底還是對於R420性能預期的不確定,人們最關心的是它是否像NV40那樣,相對於前一代產品會產生質的飛躍,進行一次徹底的革命,抑或仍然僅僅停留在對R3XX架構的改良上。
而評測中心在經過了漫長的評測後,認為從總體結果看,這次測試的X800 Pro可以用「喜憂參半」來描述。一方面,X800 Pro有明顯提升改進的地方,另一方面也存在比較保守地留用現存架構的情況。而從目前國內外諸多評論看,也有類似的說法。有的人說R420的出現和NV40一樣是一次飛躍,也有人則認為R420隻不過是R360的「放大」版本。究竟是怎麼樣,請您繼續看本文後面的測試部分,我們將結論留個廣大讀者自己評判。
在開始對X800系列顯示晶片的規格作介紹之初,ATI給了廣大用戶一個相當明確的解釋:「Comprised of 160 million transistors, they build upon the highly acclaimed RADEON 9800 architecture and extend it by providing major increases in bandwidth, parallelism, efficiency,image quality, and programmability.」
這句話中,明確指出了X800系列顯示晶片的架構是「基於廣受好評的RADEON 9800架構並進行了一系列改進以後誕生的一款產品」。那麼除了這1億6000萬的龐大電晶體數量之外,R420顯示核心相對於R360還有哪些變化呢?我們來看看規格的對比表格
我們看到,這張表格中對比了4款不同顯示卡的規格,從中可以直觀的看到以下幾點:
◎ 電晶體數目增加
從R360升級到R420顯示核心,晶片內部的電晶體數目有了一定的增加,從原來的1億1000萬增加到了1億6000萬,增加了45%。
◎ 頻率進一步提升
我們看到,無論是核心頻率還是顯存頻率,在X800上都有一定提升。X800 Pro的頻率達到了475/900MHz,而高端的X800 XT更是達到了520/1120MHz。這些數值要比NVIDIA的對應產品高上不少。以上頻率均為ATI在5月18日中國發布會公布。
◎ 管線增加
處理頂點數據的Vertex管線數量增加了50%,達到了6條。而像素處理管線,則分別增加了50%和100%。從這兩項看,X800XT在管線上的設置和NVIDIA最新的顯示晶片GeForce 6800Ultra的數目完全一樣。
表格中有多項數據對比,但真正吸引我們眼球的卻僅僅只有上面這三項,為什麼呢?因為其他的項目大部分是理論上的處理能力參數,我們完全可以從頻率和管線兩個方面來解釋。
例如,我們看到新的Vertex管線增加了50%,而頻率增加了21.3%。對比看頂點處理能力的時候,用R9800XT的412M/s×1.5×1.21,得出的就是X800XT的750M/s的頂點處理能力。其餘的各個處理能力也都可以這樣推導。<
接下來,我們一起看看X800的架構示意圖。
我們看到在新的X800圖形晶片內部架構圖中,主要包含了以下幾個部分。
◎ AGP接口成為新一代顯卡的瓶頸
首先是負責和CPU通信的AGP接口。這個部分承擔著所有和計算機進行數據通信的工作。目前AGP接口的帶寬雖然不斷提高,但是仍然被認為已經嚴重影響了顯示卡的性能發展。因為相對於顯卡內部動輒數以十數GB/s而論的帶寬,AGP接口那僅僅2.1GB/s的帶寬就顯得十分捉襟見肘。
AGP接口將數據從CPU讀入以後,將數據傳輸給顯存控制器。後者的作用不僅僅是控制數據在顯存中的存儲,還承擔著顯存的數據接口作用。它一共連接著6種不同的功能部件。除了顯存本身以及AGP接口以外,它還要負責將數據傳輸給2D引擎、視頻處理引擎以及3D引擎。而其中3D引擎則同時和頂點處理器,以及「Hyper Z HD」引擎相連接,將數據傳輸給這些部分。
2D顯示引擎和視頻處理引擎部分我們沒必要多談了,這兩個部分分別負責2D顯示的運算以及視頻回放處理。它們將數據處理完以後就可以直接將準備顯示的數據放進顯示接口(Display Interface)。
◎ 複雜的3D處理環節
接下來,我們就進入了最關鍵的3D處理的一整套環節中了。3D圖形處理是按照一定的順序執行的,最主要的就是先進行幾何方面的運算,然後進行像素處理方面的運算。當然,這個過程也不是這麼簡單的,複雜的3D幾何運算過後,還要將這些3D點換算成在屏幕上顯示的具體像素,這個過程就是由Setup Engine實現的。
在像素處理管線以後,還要根據需要進行圖像的後期處理,在X800圖形晶片中,它的後期的圖像處理引擎被稱為「SmoothVision HD」。
這些後期的處理過程能夠生成實際需要顯示的數據,所以它們均將最終的數據傳入顯示接口,經過一些相對簡單的處理以後輸出至顯示設備。<
無論是顯示晶片還是CPU,凡是這些精密的晶片,始終都在追求工藝上的提高。從0.25μm,到0.18μm,再到0.13,甚至0.09……生產廠商在這方面的追求從不曾停止。
這次X800採用了0.13μm工藝製造,這比上一代產品Radeon 9800的0.15μm製造工藝要提高了一個層次。這一改進最直接的好處就是晶片運行頻率提高了100MHz但發熱量仍然控制得很好。
Radeon X800晶片
代工廠商方面,ATI選擇了TSMC作為他們最新產品代工廠商,並採用了最新的Low-K工藝來生產R420顯示晶片。
這次的0.13μm工藝採用了銅互連技術。銅由於比鋁有更好的延展性和導電性,所以使得在傳輸信號的時候,能夠保證在更細的電路中獲得更好的信號質量,而這正是增加頻率,提高性能的物理基礎。另外,採用更先進的工藝有利於在同樣尺寸的晶片上實現更多的電晶體。而電晶體本身就是實現運算的最基本單元。電晶體數目越多,也就意味著晶片能夠實現更加強大的功能。
我們前面已經看到了X800顯示晶片的架構,這顆晶片在頂點處理管線以及像素處理管線上均有一定程度的升級。其中頂點處理管線增加到了6條,像素處理管線增加到了16條。
我們注意其中的像素處理管線。這16條管線在硬體上是如何實現的呢?ATI公司採用了一個方法,就是將這16條管線平均分為4組,每組4條,ATI將其稱之為「塊」。這樣就可以方便的實現對像素處理流水線的控制了。
顯卡設計者可以通過屏蔽掉相應的塊來決定一個顯示核心的像素處理流水線的數量。這樣ATI的X800系列顯示晶片,便有了擁有完全16條管線的X800 XT以及只有12條管線的X800 Pro。除此之外,後期更可以推出4條管線和8條管線的版本。<
ATI這次最新發布的X800系列顯示晶片,統一都採用了256bit的顯存帶寬,這256bit又被分為4個獨立的通道,每個通道64bit。對於顯存,X800系列顯示晶片的標準配置是GDDR3顯存,這種顯存相比原來的顯存來講,能夠運行在更高的頻率上。這樣X800上的顯存數據帶寬就能夠輕易的達到32GB/s以上了。
我們前面提到,X800系列顯示晶片採用了4個獨立的內存控制器,但是這並不意味著每一個內存控制器僅僅能控制4個內存模組中的一個。ATI採用了一個用來切換內存控制器和內存連接的裝置「Switch」來保證這4個內存控制器和4組顯存能夠完全自由連接。當然,這個過程中還有一個非常重要的事情就是如何將數據傳入內存,「Switch」同時也負責將一個總線控制器和任何一組內存進行連接。<
● 頂點處理引擎
3D圖形運算最基本的單位就是每一個單獨的點。因為有這些點,才能根據這些點的坐標計算兩點間的線以及三個點形成的面。所以說3D圖形處理中幾何部分的處理,其實就是對空間中的點進行運算,這也就是為什麼人們會將3D圖形中幾何處理的引擎稱之為「頂點處理引擎」。
我們首先來看看X800系列顯示晶片中的頂點處理引擎的架構。
我們看到,當頂點的初始數據傳入頂點處理引擎的時候,數據被分配至6條並行的管線之中。這6條管線分別擁有一個128位矢量數據算術運算單元以及一個32位標量數據的算術運算單元。數據經過矢量運算以及標量運算以後,並不一定就是最終需要的數據。而且由於矢量運算器和標量運算器的關係是並行的,所以有的需要進行兩種運算的數據就需由流程控制器(Flow Control)再次送入前面的運算單元了。
在經過了6條並行的數據運算以後,頂點處理的過程只能說是完成了其中最重要的部分,但是距離數據最終輸出還有很遠。
接下來進行的過程需要進行遮掩面的選擇(Backface Culling)、數據整理(Cliping)、透視分離(Perspective)和最後的可視範圍變換(Viewport Transform)。經過這4個過程以後,數據就可以輸出至將3D數據轉換為2D數據的「Setup Unit」了。<
● 裝入引擎(Setup Engine)
Setup,我們最先熟悉這個詞的時候一定是在安裝軟體時候認識的。在3D圖形處理中的Setup引擎完成的是一種怎樣的工作呢?
在前面進行的頂點處理過程中,所有的頂點都被獨立計算它們的位置。然而在實際的3D模型中,卻不能夠以純粹的點來表示3D模型,更多時候需要藉助兩點間的線以及三個點圍成的面來實現,所以將點和點之間的聯繫省略儼然是不可取的。
Setup引擎的作用就是將這些獨立的點再次結合到一起,組成最基本的三角形。因為任何多邊形的最基本的元素就是三角形,所有複雜的多邊形均可分離成為大量獨立的三角形。
Setup引擎的具體架構分為兩個部分,首先是幾何匯集(Geometry Assembly),這個步驟的作用就是將獨立的點重新連接成一個個三角形。第二步就是Setup單元,這個部分完成的工作就是將一些作用在三角形上的函數分派至具體的三角形上。
在上圖中,Setup引擎首先將獨立的點連接成為三角形,然後將三角形安排在很多的塊中,然後根據頂點在這些塊中的位置來確定怎樣對三角形進行處理。<
● 像素處理引擎
3D處理過後,我們就要進入2D處理的環節了。這裡稱之為2D,並不是和前面我們提到的2D處理引擎相同。這裡是指將3D運算結束以後,在像素級別進行的處理過程。這個過程我們也已經非常熟悉了,這就是經常被提到的Pixel Pipline(像素處理管線)。
X800系列顯示晶片的像素處理管線一共有16條,這比原來的R9800XT上的8條增加了一倍,這就意味著在理論上,即使頻率保持不變的情況下也能有一倍的像素處理能力的性能提高。
像素處理管線的架構圖
我們看到在這16條管線上,ATI採用了4組4條的設計。這樣的設計不僅可以更加有效的控制管線條數,也可以保證在其中一條失效的時候,不至於被迫放棄整個晶片,而僅僅屏蔽掉其中的一組就能作為X800Pro或者標準版來出售了。
一組像素處理管線架構圖
一個獨立的像素處理單元的架構圖
我們看到,在像素處理的環節,其複雜度遠遠超過了前面的頂點處理部分。因為在一個場景中每時每刻都要運算的數據點是海量的,而且這些點包含的信息也絕不僅僅是一個坐標而已。它還包括顏色、亮度和其他點的關係在內的各種數據,這些都要進行不斷的運算。這也是為什麼在像素處理部分的管線需要16條,而頂點處理部分則僅僅用6條的原因。<
我們前面介紹了X800系列顯示晶片在架構方面的一些情況。這些架構層次上的情況基本上可以算是硬體結構,它們是發揮產品效能的一個基礎。那麼如何才能將這些管線以及各種各樣的單元發揮出最大的效果呢,這就需要相應的技術作為支持。X800系列顯示晶片誕生的同時也是ATI展示最新技術的一個絕好機會,我們就趁此來看看隨X800而來的各種新技術應用。
在X800發布的過程中,ATI發布了以High Definition Gaming(高畫質遊戲)為主題的一些最新的技術,其中包括:
· SmartShader HD
· SmoothVision HD
· Hyper-Z HD
· 3Dc
這其中的3Dc技術筆者已經在《紋理壓縮的奇妙之旅 漫談X800的3Dc技術》中有過詳細的介紹,在這裡就不再贅述了。
首先,我們來看看X800系列顯示晶片中帶的SmartShader HD技術。對於SmartShader技術我們已經非常熟悉這個名稱了,早在Radeon 8500發布的時候,ATI就推出了他們的第1代SmartShader技術,這次推出的SmartShader HD是其第4代技術。
SmartShader HD技術本身其實是一個技術的合集,其中包括了關於頂點處理引擎以及像素處理引擎的技術,其名稱中「Shader」正是VertexShader和PixelShader中的「Shader」。
● VertexShader方面的改進
VertexShader,這個名詞我們可以說在所有的硬體文章中都頻繁的見到,但是究竟這個「Shader」應該翻譯成什麼,筆者還沒有完全搞明白。反正對於最常用的翻譯方法「頂點著色器」的說法,筆者認為不盡正確。雖然「Shade」的意思中有「遮蔽」的含義,但是在3D處理晶片中,頂點運算絕不僅僅是一個「著色」或者是「遮蔽」的過程,其具體操作非常複雜,絕不是一個「著色器」能夠涵蓋的。
VertexShader這個名字的出處來自於DirecX規範,其本意是一組針對頂點處理的函數的集合,顯示晶片廠商在研發顯示晶片的時候,將這些功能用他們的顯示晶片在硬體中實現。
SmartShader HD技術能夠很大程度提高VertexShader的性能。由於增加了頂點處理管線的條數,並且能夠在每個時鐘周期中進行兩次操作,在數據的精度方面X800支持32位的精度。
頂點處理能力的增強主要會體現在一些幾何運算量非常大的情況中。例如波濤起伏的海面上擁有大量的三角形,採用最新的X800顯示晶片進行運算的時候就能很大程度上提高速度。
● PixelShader方面的改進
相對於面向頂點坐標運算的VertexShader,PixelShader的作用則是面向像素的處理,也就是最終顯示在顯示器之前的畫面處理。
同樣的,由於管線條數的增加,PixelShader的能力有了大幅的提高,X800系列顯示晶片最高能在每秒鐘完成400億條像素的運算操作。這些操作完全支持了DirectX 9.0中數據格式24位精度的要求。
對於程序中指令的長度,SmartShader HD也有一定的改進。在R360時代,每個PixelShader程序的指令最大長度僅僅為160條,而到了X800上,則可以支持1536條指令。<
● 虛擬位移貼圖(Virtual Displacement Mapping)
虛擬位移貼圖技術是一種效果非常好的準3D技術,為什麼說是「準」呢?因為這項技術類似於法線貼圖(Normal Mapping),並沒有像位移貼圖(Displacement Mapping)那樣實現真正的3D效果。這種技術主要依靠後期的PixelShader來將貼圖進行一些局部形變,再配合陰影效果來實現3D效果。這種技術比起傳統的凹凸貼圖以及法線貼圖有更好的效果,但是又不會像位移貼圖那樣消耗過多的幾何處理能力,所以這種技術可以說是一種結合位移貼圖技術和法線貼圖的優點的技術。
X800憑藉其支持的SmartShader HD技術,在虛擬位移貼圖上能夠實現比較好的效率,從而在消耗資源很小的情況下得到了非常好的效果。
左為虛擬位移貼圖效果,右為普通貼圖
● 高動態範圍(HDR)
高動態範圍的效果我想大家也已經有所了解,這種技術的主要目的就是通過更高的精度來表示細節,這樣就能夠讓計算機表示的動態範圍不再僅僅局限於255級,而是更加接近人眼能夠分辨的範圍。
ATI這次推出的X800系列同樣支持了高動態範圍技術,我們可以看到圖中高亮的部分仍然保持了相當豐富的細節。<
● 景深效果(Depth of Field)
稍微有些攝影基礎的朋友一定都非常熟悉「景深」這個詞了。如果非要解釋這個詞的話就是「在攝影機鏡頭或其他成像器前,沿著能夠取得清晰圖像的成像器軸線所測定的物體距離範圍」。說得再簡單一些,就是距離不同的景物,呈現出有些地方清楚有些地方模糊的效果。這種效果能夠更加突出需要反應的焦點,讓畫面的主題更加鮮明。
我們觀察上面的兩張圖片,就能非常明顯的看出景深的效果。在第一張圖片中,手持長棍的忍者是清楚的,後面的景物時模糊的。而在第二張圖片中,焦點移到了後面的景物上,前景的忍者反而變成了模糊的效果了。這樣的效果更符合人肉眼對自然環境觀察的結果,也就因此令玩家的感受更真實。<
在日常生活中,我們見到的影子通常都不是非常銳利的。而現在X800圖形晶片也可以實現這樣的「軟陰影」的效果了。我們看如下的圖片,Ruby的頭髮在臉上形成的影子,左邊的影子十分銳利,而右邊的影子邊緣已經是模糊的了,這種效果和我們實際生活中的視覺體驗非常相似。
產生這種現象的最根本的原因就在於光源。在實際生活中,我們見到的光源幾乎不存在真正意義上的「點光源」。無論一個光源多小,它都是有一定的面積的。但是在計算機圖形中,情況卻是相反的。在電腦的運算中,不可能有一個真正的面光源或者是線光源,所有在計算機中的光源全部都是點光源,即使是用多個點光源模擬線光源或者面光源也是非常難於實現的。
那麼ATI怎樣在Ruby的臉上實現了軟陰影的效果呢?答案是他們採用了貼圖的方式,將陰影層貼圖的邊緣模糊化,然後再貼到Ruby的臉上,最終實現了軟陰影的效果。<
● 複雜的折射和反射
在X800支持的SmartShader HD技術中,可以讓非常複雜的光的折射和反射都能夠得到滿意的解決,在《DoubleCross》的演示Demo中,一顆五光十色的鑽石成為了整個Demo的主線。ATI在這顆鑽石上採用了非常複雜的光的折射和反射技術,使得效果和實際非常接近。
我們看到,在鑽石表面的處理上,對於折射和發射的效果做的都非常逼真。
● 次表面散射技術
次表面散射技術的主要作用,是在某些特定場景中,針對需求營造出一種半透明的效果。
● 體積光效果
不知大家是否還記得侯寶林大師有一個著名的段子叫做《醉酒》,其中的一段經典的臺詞便是在夜裡打開手電往空中照,便能顯現出一道光柱來,這就是體積光。由於在理論中,光在途中並不會被人發覺,只有通過了有灰塵或者煙霧的環境中才能由於散射被人們所看見。
SmartShader HD提供了模擬這一現象的能力,使得光線顯得更加逼真。以後在遊戲中見到這樣的場景您就會對它有更深刻的印象了。<
● SmoothVision HD
ATI的SmoothVision HD技術同樣是一個有著一定歷史的技術,發展到X800的時代就多了一個「HD」的後綴。SmoothVision HD技術只要面向的是後期的圖像的處理,這裡面包括了抗鋸齒、伽馬校正和材質過濾等多種技術。
對於SmoothVision HD中支持的抗鋸齒方面的技術,絕大部分是和目前已經被廣泛採用的技術類似的,所以在這裡我們就沒有必要再說那些事情了。值得注意的是在X800系列顯示晶片中,首次增加了一種全新的抗鋸齒採樣方式,這就是近期大家討論非常多的Temporal Anti-Aliasing(臨時取樣抗鋸齒)。
● Temporal Anti-Aliasing
這種全新的抗鋸齒的原理是這樣的:
每一幀採樣的位置不同,連續兩幀的取樣位置也不同。這樣就能夠在兩幀來回切換的時候,利用人眼的視覺暫留特點,實現接近於兩倍原有取樣的效果。但是這個過程由於每一幀的取樣點數並沒有提高,所以在性能上將不會有任何下降。
另外,這種技術產生的抗鋸齒的效果只能由肉眼看出來,如果進行抓圖的話,仍然將截取到其中的單一幀,所以通過截圖是看不出這種「臨時採樣」的抗鋸齒效果。<
● 伽馬校正
這項技術有助於彌補在抗鋸齒的過程中,線性分配伽馬值所帶來的細節損失,使圖像細節更加豐富。我們可以清楚地注意到,在沒有採用伽馬校正的情況下,暗部細節不容易顯現出來,而採用了這一圖像增強技術以後,圖像的層次更加明晰了。
● 材質過濾
SmoothVision HD技術在材質過濾方面也有著不錯的表現,其最高支持16X的各項異性過濾是高畫質圖像顯示的重要的一個環節。
● Hyper-Z HD技術
Hyper-Z HD技術是一種用來減少資源浪費的一種技術。我們知道,如果要在畫面上實現某個3D的圖形,就必須知道這個圖形到觀察者的距離。存放這個距離的就是我們常常提到的Z軸緩衝(Z-buffer)。
在實際的運行中,Z軸緩衝需要被不斷的進行運算,並且不斷的改寫。這個過程對於顯示晶片來講也是一個考驗。Hyper-Z HD技術的目的就是減少Z-Buffer所佔的空間,從而達到提升性能的目的。
Hyper-Z HD技術是由多個不同的技術所共同實現的,其中包括:
Hierarchical Z
這次測試所用的顯卡是來自華碩的X800 Pro規格的產品。關於它更多的細節,我們已經在《R420的誘惑 華碩X800 Pro抵達評測室》中有過詳細的介紹了。
Early Z Test
Z Compression
Z/Stencil Cache
Fast Z Clear
在本次接近尾聲的時候,我們開始陸續收到多家廠商送來的X800。但華碩的這款產品,是本次評測最早收到的第三方廠家顯卡,也因此成為本文的測試主角。<
本次Radeon X800 Pro的測試平臺如下:
硬體系統
處 理 器
Intel Pentium4 3.4E GHz [800MHz FSB]
主 板
華碩P4P800 [865PE晶片組]
內 存
Apacer DDR400 1GB [512MB×2]
硬 盤
Seagate Barracuta Ⅴ 60GB
顯 示 器
愛國者 998FD
電 源
鑫谷 核動力合金版 實標400W
驅動程序
主板驅動
Intel Chipset Inf
5.1.0 .1008顯卡驅動
NVIDIA Forceware 61.11 without WHQL
ATI Catalyst 4.5 WHQL
作業系統
英文Windows XP + SP1
作為對比,我們使用了一塊GeForce 6800U降頻後得到的GeForce 6800GT作為對比,之所以我們採用這種方法,是因為GeForce 6800GT在硬體規格上處理管線沒有任何縮減,只是將頻率降低,所以降頻後的GeForce 6800Ultra和GeForce 6800GT是完全相同的,這也是我們採用這種方法的原因。
與我們以前的測試平臺相比,本次測試在以下方面有所改變:
● 首先,我們和之前的大多數測試不同,採用了目前Intel最新的處理器,Prescott內核的P4 3.4GHz,而我們之前使用的通常是Northwood內核的3.0GHz的Pentium處理器。採用這顆處理器的主要考慮是CPU主頻的原因,為了能夠儘量減小CPU子系統對整個系統的影響。
● 內存方面,我們在這次的測試平臺上使用了1GB容量的內存,這相對我們一貫使用的512MB容量而言一個重大改變。我們這次採用了Apacer(宇瞻)的兩條512MB的DDR400內存,採用的內存時序設置為6-3-3-2.5。
● 主板方面,這次由於我們使用了最新的Prescott核心的CPU,所以我們的主板就需要進行相應的BIOS升級。我們採用了華碩官方發布的最新的1016版的BIOS,升級了我們的P4P800主板,使之能夠完全支持這款處理器。 <
本次測試我們選擇了基於NV40核心的GeForce 6800GT與Radeon X800 Pro做對比測試,而之所以沒有將GeForce 6800 Ultra列入其中,原因在於它和X800Pro實際上並不處於同一水平線上。相比之下,ATI的X800XT才應該與6800U正面交鋒,相關的測試我們也會陸續呈現給大家。而同樣為12條渲染管線的6800標準版,因為國內一直無法拿到相應的產品,所以也只得暫時缺席本次評測。
GeForce 6800GT的核心與顯存頻率分別350MHz/1GHz,而對應的Radeon X800 Pro則為475MHz/900MHz。二者可謂互分勝負,此外從規格上講,R420核心並不支持ShaderModel 3.0,它僅支持到PixelShader 2.0與VexterShader 2.0,這也可以算是R420的「硬傷」了。
在本次測試中,我們的起點依舊很高,因為考慮到CPU已成為瓶頸所在,所以多數測試均以1600×1200的解析度開始,並且加入了各級的FSAA與AF,以做到榨乾顯卡的最後一滴「油水」。此外,為了顧及到大部分玩家依舊採用1024×768等解析度進行遊戲,我們在個別測試中也加入了諸如1024×768和1280×1024解析度下的測試,以求將全方位的將評測信息呈現給您。
我們的測試項目共有12項,分別為:
◎ 綜合Benchmark測試部分
AquaMark 3、3DMark 03 Patch340;
◎ 遊戲及專用軟體測試部分
·Halo(光環)
·Splinter Cell(分裂細胞)
·Quake3 Arena v1.17
·UT2003(虛幻錦標賽2003)
·X2 The threat
·Max Payne 2(馬克思•佩恩 2)
·Prince of Persia:The Sands of Time(波斯王子:時之砂)
·FarCry v1.1(孤島驚魂)
·ShaderMark v2.0
·Colin McRae Rally 04(柯林•麥克雷拉力04)。可能有些朋友會發現,為什麼本次X800 Pro的測試中沒有看到UT2004的身影?實際上,在我們此前對6800U的評測中,UT2004的表現就不是十分不穩定,每次測試的分值差異都很大,需要將多次測試的數值加以平均方可採用。這也表明了目前UT2004自身還存有一些問題有待於改進,因此在本次測試中,我們毫不留情的將它砍掉。<
對於AquaMark 3這款測試軟體,廣大讀者想必已經相當熟悉了。AM3是全球首款提供了真實DirectX 9遊戲引擎的商用測試軟體,測試成績較為公正,被各評測實驗室廣泛採用,已經成為目前最為通用的一款3D圖形測試軟體。
這次我們在AquaMark 3的測試中重點考察3項測試:標準得分測試,1600×1200解析度下打開4×AA和8×AF的測試,以及像素填充率的測試。
可以看到,每項測試6800GT均取得了領先,不過幅度並不是很大,大多維持在5%左右。即使在最大解析度以及最高畫質的情況下,X800 Pro也僅僅落後不到2幀。這樣的差異在實際運行當中並不會有明顯的感覺。<
3DMark這款測試軟體的「悲慘命運」我們已經非常熟悉了,因為該款軟體在人們心中的地位,所以造成了爆出不少關於有些顯卡在這款軟體中作弊的消息。但NVIDIA最新驅動的測試成績得到了3DMark官方的認可,而ATI也同時獲得了X800系列支持3DMark的最新補丁,所以我們沒有理由不測試它。
在3DMark 03中,6800GT領先的優勢逐漸顯露出來,並且自始至終維持在20%以上。<
前面我們進行的3DMark 03的測試中,均是基於4個遊戲場景測試的部分。為了能夠更加全面的反應一款顯卡的性能,我們還進行了3DMark 03中提供的特效測試。
● 像素填充率測試中的單紋理貼圖
● VertexShader測試
● PixelShader測試
● Ragtroll測試
6800GT依然在大部分測試中保持優勢,但在VertexShader的單項測試中,卻一反常態被X800Pro得到了第一次反超的機會,而且領先幅度接近20%。<
Q3A這款遊戲再老,我們在沒有合適的替代品時仍然不能捨棄它,這款遊戲我們使用它的目的仍然是看看在OpenGL項目中顯卡的表現。
我們進行了High Quality模式下3種解析度的測試,此外我們也打開了FSAA與AF。
毫無疑問,CPU在這裡又一次制約了顯卡性能的發揮。在常規解析度下,6800GT只有10幀左右的領先優勢。但隨著解析度的增加,兩塊顯卡之間的差距也逐漸顯現了出來,在1600×1200解析度的環境下,6800GT的成績依然接近400幀,但X800Pro則略現疲態,以落後50fps的成績居於其後。<
我們接下來再進一步的對GeForce 6800 Ultra來進行全屏抗鋸齒能力的測試。
和前面的情況十分類似,高解析度下,兩塊卡的差距顯而易見。<
在進行過全屏抗鋸齒的性能測試以後,我們再將目光集中在GeForce 6800GT在處理各向異性過濾時的能力。和前面一樣,我們同樣採用了3種不同的解析度。
在高解析度環境下,X800Pro被落下了100幀之多。這樣的差距就太明顯了。<
既然全屏抗鋸齒和各向異性過濾都不足以難倒「神奇」的新一代顯卡,我們決定一起上,在3種不同的解析度上同時加載這兩項特效。
53→107→100,這是次第在3個解析度下6800GT與X800Pro之間的差距。這也再一次證明了NVIDIA在OpenGL方面的強大實力。兩款顯卡目前各自的官方報價都是399美元,這樣的性能差距如何是好。<
作為移植自XBOX上的大作,Halo在畫面方面也使用了一定的DirectX 9特效。儘管遊戲的移植工作存在一些瑕疵,畫面效果相比其它同期推出的DX9遊戲也顯得稍遜一籌。但作為一款號稱拯救了XBOX的遊戲,本身的可玩性還是很高的。加之遊戲還附帶了十分方便的timedemo測試功能,自然也成了我們顯卡測試的工具之一。
本次評測我們加上了1024×768解析度下的測試,此外,1600×1200的解析度當然也要得以保留,並且將各向異性過濾的等級開到各款產品共同達到的最大值——8×。
與Q3A中6800GT壓倒性的勝利相比,在Halo二者幾乎難分高下,X800 Pro也僅以微弱的劣勢落後於6800GT,2~3幀在實際應用中也幾乎可以忽略不計。<
Splinter Cell這款遊戲的誕生是根據著名的軍事題材小說家湯姆·克蘭西的同名作品改編的,湯姆·克蘭西的作品經常被改編成遊戲,像我們熟悉的《雷霆行動》、《彩虹六號》、《幽靈行動》等等都是根據這位高人的作品而改編的。
Splinter Cell這款遊戲最出色的就要數它的光影效果了,其複雜真實的光影投影效果讓很多顯卡在這款遊戲上都顯得力不從心。
今年春季的遊戲大潮中,Splinter Cell的第二部作品《分裂細胞2:明日潘多拉》也已經發布了,這款遊戲和第一部不同,加入了多人遊戲模式,使遊戲性更加強了一大塊。不過,「明日潘多拉」依然是一款基於DirectX 8.1的遊戲,而且在測試方面並沒有第一部Splinter Cell方便,所以我們仍然採用了第一部作品進行我們的測試。
隨著解析度的上升,兩款顯卡的表現也同步改變。雖然還是有所落後,但X800 Pro這次緊緊咬住GT不放。在每一個單項測試,6800GT均保持著5幀左右的領先優勢。<
以華麗畫面著稱的「虛幻」系列遊戲一直備受FPS玩家們的推崇,而UT2003在多人對戰模式所取得的成功,更是讓這款遊戲走向了韓國,走向了WCG的競技場,讓全世界更多的玩家所熟知。
同時,UT2003在顯卡測試領域裡也樹立起了自己的威望,Flyby、Botmatch這兩個針對性和側重點各有不同的項目幾乎已成為衡量DX8.1性能的一把標尺,而在全世界的硬體評測室得到了廣泛使用。它的測試結果也具備相當的參考價值與權威性。
在Flyby和Botmatch兩個測試中,前者最早來自於UT2003多人對戰前的地圖預覽。遊戲通過對地圖預覽幫助玩家熟悉環境(地形和武器分布等等),久而久之變演化成了UT2003的一項測試程序。而Botmactch通過模擬一個多人對戰場景,在相對固定的環境中生成了大量的多邊形。人物間彼此的射擊、命中、血光四濺……都使得顯卡的負荷明顯提升。在這個過程當中,便可以考察一款產品的運算處理性能。
在Botmatch模式下一對冤家依然難以拉開差距,這種情況在Flyby下則完全不同,可以看到,它們的差距比較明顯。<
讓我們看看在更高畫質的情況下,兩塊顯卡的表現如何:
在1600×1200的解析度中,在打開AF的環境下,ATI向人們展示了它在各項異性過濾方面的過人之處。「全線飄紅」是我們在這裡對X800Pro的概括。可以看到,每一單項測試X800 Pro均取得了不同程度的領先,不禁令人刮目相看。<
德國遊戲開發小組EgoSoft曾在1999年推出過一款飛行模擬類遊戲《X: Beyond the Frontier》,而本次用於顯卡測試的X2 Rolling Demo則是該款遊戲的最新續作。作為DirectX 9的測試項目,我們在本次評測中也將這款遊戲列入其中。
對於X2的測試,我們僅選用了1600×1200的解析度,同時打開4倍的全屏抗鋸齒與8倍的各向異性過濾,下面請看實際的測試數據:
在這款基於DX9的遊戲中,6800GT可建立起約15%的的優勢。<
與曾經轟動一時的《馬克思·佩恩》相比,續作《馬克思·佩恩 2——馬克思·佩恩的墮落》的聲勢顯然小了許多,但諸多特效的應用與華麗的畫面表現,仍使它不失成為一款優秀的顯卡測試軟體。
由於遊戲沒有提供錄製demo的功能,所以我們選擇了Fraps 2003這款工具,通過兩個過場動畫來完成測試,而我們所使用的遊戲版本為1.0。
可以看到,在《馬克思·佩恩2》的測試中,6800GT與X800Pro的差距相當小,總體上可以把這些差距忽略過去。除去在打開4×FSAA的狀態下,demo2中6800GT的優勢比較明顯外,其餘的測試二者基本持平。<
曾經風靡一時的「波斯王子」系列如今由育碧公司推出了最新作——「時之砂」,它絢麗的畫面效果和極強的可玩性給這款古老的系列遊戲帶來了新的活力和如潮的好評,它也順理成章的成為我們選擇的測試遊戲之一。
我們測試使用《波斯王子·時之砂》的1.3.0版本進行,測試工具為Fraps 2003,測試時關閉遊戲音效。
與《馬克斯·佩恩 2》一樣,我們同樣採用測試兩段過關3D場景動畫(demo1,demo2)平均幀數的方法進行。我們使用遊戲在「Did I meet her before」存檔點中的兩段過場CG,以下為測試結果。
我們看到,6800GT在所有的測試項目中均一路領跑,只是領先的幅度波動較大,最大可拉開30幀以上,而最小只有1幀。<
《柯林·麥克雷拉力 04》(簡稱CMR4)是一款近期剛剛推出的賽車遊戲。這款遊戲以其絢麗的遊戲畫面以及出色的操控感贏得了眾多賽車愛好者的青睞。這款遊戲雖然仍然不是一款支持DirectX 9的遊戲,但是其場景複雜,賽車的表面光澤,車尾的煙霧效果都非常好,而且耗費顯卡資源也比較高。
我們的測試採用了Fraps來進行測試,測試方法我們學習了tom’s hardware的經驗,不僅能夠方便的測試,而且測試結果的誤差也控制得比較好。
我們的測試直接採用了1600×1200解析度,並且交替測試了打開全屏抗鋸齒以及各項異性過濾時的情況。
測試的結果和前面我們的其他測試基本上相同,只是在8×AF的狀態下,X800Pro又一次得以翻身,以2幀的優勢取得領先。<
孤島驚魂的英文名稱是FarCry,這個遊戲最開始亮相已經是一年多以前的事情了,我們曾經在育碧:《Far Cry》有點特別,讓你體會極度狂呼!中有過介紹,這款遊戲最令人矚目的就是它的畫面效果,在此後的一年時間裡,關於這款遊戲的消息以及截圖就不斷的傳出,而且在環境效果的營造方面,這款遊戲也非常的出色。
FarCry這款遊戲的劇情大致是一位名叫Jack Carver的退伍(美國的?特種兵?軍官?僱傭兵?網上的說法很多,也不知道信誰的,反正是個有軍方背景的人啦),在南太平洋的一個群島做租賃快艇的生意。一天,被一個人租船到另外一個島的時候,發現這個島已經被人改造成為一個軍事基地,而這裡正是恐怖分子研究生化武器的基地,主人公隨即被捲入一場精彩刺激的冒險旅程中。
我們PCPOP曾在前段時間推出過有關這款遊戲的詳細介紹及測試,有興趣的朋友可以參看本站文章《10款中高端顯卡對陣 終極顯卡殺手遊戲》。
關於FarCry的測試,我們直接將解析度設置在1600×1200,分別對比這兩款顯卡在不同的FSAA和AF級別的表現。要說明的是這款遊戲的FSAA有4級,我們選擇測試了最高的High和最低的None;AF有3級,我們選擇測試了最高的4級和最低的1級。
在僅打開4×AF的狀態下,X800建立起了自己的優勢,不過隨著FSAA的開啟,這一優勢變得蕩然無存。<
ShaderMark這款軟體可能還有很多朋友並不是非常熟悉。這款軟體是由德國人編寫的一款基於微軟的HLSL高級圖形語言的測試軟體。這款軟體能夠完全支持DirectX 9,並且提供了反偵測的功能,所以這款軟體的公正性得到了業界的一致認同。
月前,我們剛剛報導了「ShaderMark 2.1即將發布 GF6800U測試專用」的消息,不過2.1版的ShaderMark還沒有發布,我們這次使用的就是截至目前最新的版本。
這款測試軟體的測試項目非常繁多,兩塊卡能夠共同運行的測試一共有15個。
● Directional Diffuse Lightning
● Directional Phong Lightning
● Spot Phong Lightning
● Directional Anisotropic Lighting
● Fresnel Reflections
<
● Car Paint Shader - Multiple Layers
● Environment Mapping
● Self Shadowing Bump Mapping with Phong Lighting
● Environment Mapping
● Bump Mapping with Phong Lighting
<
● Procedural Tile Shader
● Procedural Stone Shader● Fur Shader Shells+Fins
● Procedural Wood Shader
● Refraction and Reflection Shader with Phong Lighting
Shadermark的測試表明了6800GT在Shader部分的優勢,它在大多數測試中均保持了領先。<
我們的這次測試也安排了畫質的對比,並且製作了對比用的gif圖片供大家自己考察。我們採用了AquaMark 3測試中的第150幀和第4000幀作為對比用的截圖。
畫質測試統一採用了1600×1200解析度,並且開啟4×FSAA+8×AA的設置。其中除X800Pro的截圖是這次最新截的圖片之外,其餘顯卡的截圖和我們上次在測試GeForce 6800Ultra時的圖片是一致的。
◎ AquaMark3中第150幀的截圖
我們看到,在畫質方面,我們看到,X800Pro的畫質表現和R9800XT的畫質表現驚人的一致,我們如果擋上說明的文字的話甚至不能發覺兩幀之間變化。
在FarCry的截圖對比中,由於我們採用的是手動截圖,所以不能保證截圖的位置完全保持一致,但是還是能夠看出,在4張對比的圖片中,兩塊NVIDIA的顯卡和兩塊ATI的顯卡呈現出了非常明顯的區別,NVIDIA的顯卡在遠處山石上的細節更為銳利一些。<
大家看完我們的這篇技術評析加性能評測以後一定對ATI最新的X800系列晶片的最新技術以及X800Pro的性能有了一定的了解。
● 技術部分,領導者為何選擇保守?
首先從技術的方面看,我們對這款ATI最新的顯示晶片並不是十分滿意.這是因為雖然渲染管線的數量有了大幅度增加——和NV40一樣增加到了6條頂點處理管線和16條像素處理管線,升級的積極意義是顯而易見的——但是我們卻發現除了這些管線的增加以外,幾乎找不到其它真正的硬體層面的架構升級。從這一點而言,R420更像是R360的大幅增效版,而不是一款從架構上有徹底革命性領先的晶片。
最令我們感到不解的是R420針對未來必然成為主流,已經得到DirectX 9.0c明確支持的PixelShader 3.0和VertexShader 3.0並沒有提供。雖然在當前這一標準在實際應用中還遠未普及,但以ATI一向重視技術領先的風格而言,卻頗為背道而馳。因為我們回首看前幾代顯示晶片的發展,會注意到ATI始終是支持最新技術的領先者,而這次在ShaderModel 3.0的問題上,ATI的選擇令人迷惑。
關於這個問題ATI官方的說法是,目前的遊戲還沒有發展到足夠讓ATI做些什麼的地步,即使是ShaderModel 2.0支持的遊戲也是寥寥無幾。誠然,這一點我們也承認,因為即使是今年開春的遊戲大潮,真正支持DX9的遊戲也只有《FarCry》一個。
然而,ATI這種「不作為」的態度卻引起了大家的討論。有的人認為ATI這次並不是不願意做到支持ShaderModel 3.0,而是在研發R420之初沒有預料到整個趨勢的發展勢頭如此之快——或許對ATI而言,按原計劃要到R423或者更後面的產品才對3.0作出支持,而NV40的出現無疑打亂了這個計劃。也有人說那些技術其實真的沒什麼用,而且ShaderModel 3.0也不是為了提高畫質而來的,NV40支持的那些新技術也都是距離實用非常遙遠的事情。
不論怎樣,如果給ATI這次交來的作業在技術革新層次上打個分的話,我想假如以NV40為100分的基礎,我會給ATI打上85分。考慮到ATI僅僅是對R3XX架構進行改良,就能取得如此成績,80分以上的結果是很不容易的。
● 性能部分,價格還是性能,沒有絕對的公平
客觀的講,我們的這次測試由於沒有最高端的X800 XT白金版的參加而有些遺憾。不過我們使用了擁有12條管線的X800 Pro和NVIDIA陣營的GeForce 6800GT來和這款產品對比,從排兵布陣的角度還是公平的——兩者的市場售價一致,消費者在同樣的投資下將對此作出抉擇。
當然,事事都不會是完全公正,因為X800 Pro的管線相對於頂級版本有了25%的縮減,其像素處理管線由16條縮減為了12條。
通過性能的對比我們還是可以發現一些規律。首先,總體上講,GeForce6800GT體現出了非常強大的性能,在絕大部分測試中均以非常明顯的優勢領先於對手。這和它擁有的16條像素渲染管線不無關係。
再者就是ATI仍然保持了在各向異性過濾上的成績領先,在一些高解析度下,當AF等級非常高的測試時,ATI的X800 Pro通常能夠表現出更好的性能。
另外,在一些項目中,X800 Pro也體現出了非常不俗的實力,例如在UT2003、FarCry以及Colin McRae Rally 04這些遊戲中,X800 Pro的表現還是相當令人滿意的,在一些各向異性過濾等級開到8級的項目中甚至超過了GeForce 6800GT。<
在18日ATI正式發布Radeon X800系列以後,我們PCPOP又收到了多家廠商送測的Radeon X800 Pro的顯卡,他們包括迪蘭恆進、七彩虹、翔升、銘瑄、斯巴達克、昂達、海創、藍寶再加上之前華碩送測的那一款,在PCPOP評測室同時雲集了9款Radeon X800 Pro。
由於第一批發布和展示的Radeon X800 Pro都是ATI原廠的產品,所以實際上各家的產品在設計、用料、做工方面都幾乎是一致的。經過對比所發現的差異,也僅僅在風扇散熱器的大小、電源接口以及有無獨立的視頻控制晶片上。為了讓廣大的硬體愛好者能夠先睹為快,評測室準備了很多高質量的精美圖片。下面就讓我們來一塊塊的近距離審視這些顯卡。
◎ 迪蘭恆進Radeon X800Pro
作為A卡系的著名廠商,迪蘭恆進的產品無論在做工,還是性能上幾乎都沒有人置疑。這次他們推出的Radeon X800Pro顯卡採用了很具創意的包裝,在配件方面也非常的全面,隨機贈送的光碟中有一套完整版的《HitMan Contracts》。這套遊戲的市場零售價格為49.99美元,這一點大家從書包外的宣傳畫上就可以看出。<
在發布會之前的17號,七彩虹鐳風X800Pro CH版就悄然擺上了北京鼎好電子商城的形象店。
七彩虹該款顯卡的依舊採用了《A3》人物為畫面的包裝。或許在正式上市時還會贈送遊戲光碟。由於目前商家對於X800的價位都屬於保密階段,因此對於該款顯卡售價大家只有自己猜猜了。從不久前ATI官方開賣的Radeon X800顯卡449美元的售價來看,這款新生代王者的上市價格很可能不菲。感興趣的朋友不妨關注一下。<
翔升的鐳神Radeon X800Pro也是較早送測的PCPOP評測室的產品之一。
雖然板型做工方面與其它送測顯卡無差異,但仔細對照後兩張圖片可以發現,翔升鐳神Radeon X800 Pro打著「MADE IN CHINA」,而大多數其它品牌的顯卡上打的是「MADE IN CANADA」,且還帶有「SAMPLE」的字樣。<
在18號發布會後,斯巴達克也在第一時間向PCPOP送測了他們的驚天鐳X800Pro顯卡。
斯巴達克驚天鐳X800Pro的各個方面都與ATI公版的樣卡完全一致,屬於完全標準的產品。對於這種產品,已不需要編輯在多講些什麼了,大家點擊放大看圖片吧。<
在19號,我們評測室收到了昂達方面送測的Radeon X800 Pro顯卡。
昂達Radeon X800Pro是到目前PCPOP收到的唯一一塊沒有正式包裝的裸卡。而正是這塊裸卡,讓我們看到了一些在其它Radeon X800 Pro上沒有看到的東西:如上圖中黃色的電源插口,PCB背面的「ATI Rage Theater」的視頻輸入輸出控制晶片。<
伴隨著18日ATI的發布會,銘瑄的產品線中也多了一款目前A卡系最高規格的產品——狂鐳X800 Pro。
銘瑄的狂鐳X800 Pro也是一款完整包裝、蓄勢待發的產品。從PCB背面的標籤來看,這款顯卡和翔升的鐳神X800 Pro一樣,也是打著「MADE IN CHINA」的字樣。此外,這款顯卡還附送《反恐精英》的最新版本——《零點行動》。<
海創是去年以來不斷出現在顯卡用戶面前的一個新品牌,這次他們也送測了一款黑鯊RX800 Pro勁鐳版。
作為國內有生產能力的廠商之一,海創在今年5月的時候,成為了ATI的AIB夥伴,這也是為何一個名不見經傳的品牌為何能第一時間推出ATI目前最高規格顯卡的原因。據海創方面介紹,它們將依託在板卡代工方面豐富的經驗,在今年全力進軍DIY市場,努力打造出一個以性價比著稱的品牌。<
在文章發布的前夕,我們又收到了藍寶方面送測的一塊Radeon X800 Pro顯卡。呵呵,於是乎頁碼就又要加1了。
顯卡這方面已經沒有什麼好介紹的了。不過這款產品隨卡附送PowerDVD和《古墓麗影·黑暗天使》,編者從藍寶方面得到消息,這款顯卡將周末正式上市銷售,價格為3999元,有興趣的朋友可要留意了。
聯繫人:姜小姐
聯繫電話:010-62622342 <盈通也在第一時間推出了他們的採用ATI X800 Pro的顯示卡產品,盈通鐳龍RX800 Pro:
這款產品同樣採用的公版的設計,附件也是相當的齊全。盈通作為一家專業的顯卡廠家,他們的產品獲得了廣大消費者的廣泛認可,這次在第一時間推出自己的X800 Pro產品,體現了盈通的雄厚實力。<