--》假如你只想看GTX680的測試成績,猛擊這裡吧!《--
【PConline 橫評】這幾天,顯卡業界都在小心的守護著一個「公開的秘密」:NVIDIA新一代「克卜勒」架構的旗艦顯卡GTX680,定於2012年3月22日晚上九點發布。在對手領先數輪的新品攻勢下,NVIDIA的5系列顯卡終於迎來了後繼人,那麼這款GTX680顯卡到底長什麼樣呢?它的性能、功耗、發熱量、價格又會是怎樣的呢?現在就讓我們帶您一起走近「克卜勒」吧!
NVIDIA GeForce GTX 680 圖片 評測 論壇 報價
作為計算機GPU圖形晶片領域的領袖廠商,NVIDIA GTX680顯卡發布,絕對是行業內的年度盛事。今天,在本篇「克卜勒」首發評測文章之外,我們同步上線的專題、團購、微薄等內容,還將為您帶來最全面的「克卜勒」顯卡認知,敬請猛擊下面連結。
------------------------------------------------------------------------------------
PConline為您準備了全方位的GTX680報導:
勁減1000元+送電源:PConline限量版GTX680顯卡活動
28nm時代顯卡皇者之爭 GTX680專題報導
PConline獨家專訪 N大行業領袖談克卜勒
有視頻有真相!GTX680顯卡視頻評測
隨時掌握所有信息 手機客戶端直播GTX680
最新消息隨時看 關注DIY硬體頻道微博
一頁看評測:NVIDIA GTX680顯卡測試報告
------------------------------------------------------------------------------------
● 為什麼叫克卜勒?克卜勒與GTX680的關係:
NVIDIA習慣用著名科學家的名字作為自己「顯卡架構」的代號,從Tesla(特斯拉)、Fermi(費米)到Kepler(克卜勒),這個只是內部代號,最終旗艦版的「克卜勒」顯卡命名為GTX680(如果有興趣了解更多「克卜勒」背後的故事,可點擊這裡)。
● GTX680相比上一代的GTX580有什麼改進?
GTX680的最重要改進是採用28nm克卜勒新架構,在此基礎上,顯卡核心頻率超過1GHz、顯存等效頻率達到6GHz,此外顯卡還支持動態頻率調整和DX11.1技術等。在性能提升之餘,顯卡功耗卻大幅降低,是一款有真正突破的產品(更詳細的改進,可點擊這裡查看)。
● GTX680的定位如何?競爭對手是?
GTX680與GTX580、HD7970三款旗艦顯卡
GTX680定位頂級遊戲發燒友,競爭對手是AMD的HD7970,後者在1月9日率先上市,性能超越NVIDIA上一代的GTX580,贏得了時間先機和性能優勢。NVIDIA今天發布的GTX680,首要目標就是要將HD7970砍落馬下、贏得性能第一,兩款旗艦顯卡的對戰結果,我們後面評測見分曉。
● GTX680整體外觀
NVIDIA這次發布的公版GTX680顯卡,外觀造型仍然是威武中透著靈動的黑綠色調設計,仍然採用大風量、高噪音渦輪風扇散熱。但GTX680也首次為公版N卡配備了DisplayPort接口,規格更前衛。
● GTX680的性能如何?
PConline顯卡天梯圖
在我們的實際測試中,GTX680整體性能表現在HD7970之上,是當前性能最強大的單芯顯卡,性能僅次於GTX590、HD6990等上一代「單卡雙芯」產品。點擊這裡快速跳轉到評測部分。>>
------------------------------------------------------------------------------------
1、25樓網友提出的疑問
網友原評論:GTX680很驚豔!不過太昂貴了~~~~我更期待面向主流的GTX660顯卡,不知道什麼時候上市?
PConline編輯回覆:根據我們了解到的消息,NVIDIA最快也要到6月份才會推出GTX660這類主流顯卡。覺得GTX680太昂貴?參加我們PConline限量版GTX680顯卡活動吧,立減1000元、還送1000元電源,這麼給力有沒有!(點擊查看活動)
2、48樓網友提出的疑問
網友原評論:垃圾GTX680,不能超頻。等著被HD7970超頻版秒殺吧,哈哈~~~~~~~
PConline編輯回覆:GTX680採用了新架構和動態超頻技術,目前超頻確實是有一些限制,不過已經有廠商突破限制了,大家等新的超頻軟體、或者非公版顯卡即可超頻。
3、49樓網友提出的疑問
網友原評論:GTX680的主頻怎麼是1050MHz了?公版不是1000MHz,NV又作弊了?
PConline編輯回覆:這次GTX680顯卡引入了「動態超頻技術」,其實類似Intel CPU的睿頻技術,根據負載智能調整頻率,這不算是作弊吧,呵呵。
4、65樓網友提出的疑問
網友原評論:GTX680的流處理器是GTX580的3倍,性能提升才50%,求高手解答。
PConline編輯回覆:其實文章已經說明了,GTX680和GTX580的核心架構已經不同,前者是「克卜勒」,後者是「費米」,不同架構的流處理器數沒有比較的意義。
5、136樓網友提出的疑問
網友原評論:GTX680不是DX11.1顯卡,它只支持DX11,謝謝。
PConline編輯回覆:我們聯繫了NVIDIA中國區總部進行再次確認,GTX680是支持DX11.1的。
6、154樓/311樓/317樓網友提出的觀點
網友觀點整理:GTX680代號是GK104、256BIT顯存位寬,看那做工,本來取代GTX560TI的,NV還有一個GK110才是真正的旗艦,感覺NV坑錢。
PConline編輯回覆:1、這次旗艦的代號是GK104,而不是GK100,確實是很少見,業界內外都猜測它只是GTX560Ti的繼任者,內部命名確實是「GTX670Ti」,後來NV覺得它的性能比HD7970強,所以改名了。2、至於價錢嘛,既然是旗艦,定價4K還是正常的,那做工用料,只能說NV和廠商利潤高。3、GK110,據聞是有這個東西,計劃是年底發布。
------------------------------------------------------------------------------------
NVIDIA GTX680顯卡外觀圖賞:
我們此次收到的NVIDIA公版GTX680顯卡,外觀造型仍然是威武中透著靈動的黑綠色調設計,顯卡長度為23釐米,與全尺寸ATX主板的寬度相仿,顯卡採用雙槽厚度設計,需要佔據兩條主板PCI-E擴展槽位輔助散熱。
GTX680與GTX580、HD7970
GTX680與GTX580、HD7970
GTX680與GTX580、HD7970
與GTX580、HD7970相比,這次的GTX680還是略短一些,畢竟新顯卡的TDP功耗已經降到了195W,對電氣性能的要求有所降低。
GTX680顯卡面面觀
從背部看來,顯卡保持著很高的貼片工藝水準,整體風格非常嚴謹紮實。
GTX680顯卡面面觀
顯卡輸出接口
顯卡具備DVI+DVI+HDMI+DisplayPort 4個輸出接口,第一次為公版N卡帶來了DP輸出。顯卡輸出以數位訊號為主,更適合高端玩家,更有前瞻性。而且藉助這4個輸出接口,玩家可以組建4屏顯示輸出,實現3D遊戲+1屏辦公娛樂同時進行,盡享震撼大屏體驗。
顯卡上的logo特寫
顯卡渦輪風扇特寫
公版顯卡依然採用渦輪風扇散熱設計,風量比較大,但渦輪風扇的噪音也是有耳共聽的,特別是當風扇高負載時,呼呼的風聲總是讓「裸奔」的玩家很不淡定,相比之下,業界第三方顯卡廠商的散熱方案就要前衛、個性很多。>>
NVIDIA GTX680顯卡拆解:
顯卡拆解
藉助28納米先進工藝,GTX680旗艦顯卡功耗並不高,因此顯卡也沒有採用特別誇張的散熱裝備,金屬部件不多。顯卡散熱器為銅質吸熱底座+高密度散熱鰭片設計,金屬塊內部隱藏著三條扁平狀熱管。
顯卡散熱器金屬鰭片
隱藏式的三條扁平狀熱管,用於在金屬吸熱板與金屬鰭片之間傳導熱量,金屬鰭片間的縫隙則構成了渦輪風扇的散熱風道,可以在顯卡輸出接口擋板處將熱風直接排出機箱外。
顯卡PCB
從公版PCB看來,GTX680顯卡對供電要求也不高,供電電路縱向安置在PCB尾端,這在公版高端顯卡上是不多見的。顯卡採用的是256bit顯存位寬設計,8顆顯存晶片即可達成2GB顯存規格。
兩個6pin外接供電接口
克卜勒架構圖形晶片,編號GK104-400-A2
GK104是「克卜勒」架構小晶片策略的產物,核心面積僅僅294平方毫米,晶片也不再裝備金屬蓋子。晶片上印刻有晶片產地、編碼等信息。
顯存晶片
顯卡採用的是海力士0.4ns GDDR5顯存,顯存默認頻率6008MHz。
4相核心供電電路
GTX680顯卡採用的是4相核心供電+2相顯存供電設計,供電模式為數字PMW,用料為超薄鐵氧體電感、日系固態電容、DirectFet Mos管組合方案,規格比較紮實。
數字供電電路控制晶片
為了方便布線,RT8802A數字電路控制晶片被特意安置在了顯卡北部的一塊凸起PCB上,形成了一層獨立的局部PCB,形狀像一個小小的「丘陵」。
點擊參加太平洋紀念版GTX680顯卡論壇團購活動
PConline論壇同步啟動了限量紀念版GTX680顯卡團購活動,而且在公版價格上直接向玩家優惠1000元,期待「克卜勒」新旗艦的發燒玩家不容錯過哦!>>
顯卡測試平臺和測試方法說明:
在測試平臺方面我們採用了頂級的Intel SandyBridge-E平臺(Core i7 3960X + X79)來消除CPU性能瓶頸,以最大限度的發揮出各款顯卡的峰值性能。測試平臺軟硬體配置如下表。
硬體平臺 | |
CPU | |
主板 | |
內存 | G.Skill DDR3 1600 4GB x4條 |
硬碟 | 威騰電子1TB 64M SATA3黑盤 |
顯卡 | NVIDIA GTX680 (1058/6008MHz 2GB) AMD HD7970 (925/5500MHz 3GB) |
軟體平臺 | |
系統軟體 | Windows 7 64位旗艦版+DirectX 11 |
驅動程序 | AMD催化劑12.2 FOR Windows 7 64bit |
評測軟體 |
3D遊戲/圖形性能測試: |
驅動程序方面,NVIDIA這次為GTX680配備了Forceware 300.99專用驅動,N卡桌面驅動正式邁入300系列時代。A卡催化劑驅動程序版本為12.2,在我們的實際測試中,這款最新驅動在新顯卡上的整體表現還比較穩定,對新顯卡支持比較出色。
GTX680顯卡GPU-Z檢測結果
隨著「克卜勒」的臨近,GPU-Z軟體也放出了0.6.0新版本,支持對GTX680顯卡進行全面「體檢」。從上面的檢測圖上我們可以看出,GTX680核心運行頻率非常高,而且可以最大加速到1059MHz動態頻率,但同時放棄了Shader兩倍頻設計。
NVIDIA GTX680顯卡
GTX680是NVIDIA的新一代發燒旗艦產品,競爭對手正是A卡旗艦HD7970,因此在今天的測試中,這兩款顯卡的性能角力將是我們測試的重點。而相對於上一代GTX580,「克卜勒」的實戰優勢也是今天我們想向大家展示的一個重點。另外,為了讓主力玩家明白「克卜勒」的性能水平,我們還加入了大家經常見到的當前千元級中端主力顯卡:GTX560Ti、HD6950,便於大家進行性能參考。>>
DX10基準性能測試:3DMark Vantage
作為業界第一款DX10基準測試工具,3DMark Vantage標誌著DX10世代的宏大演出正式拉開帷幕。3DMark Vantage能全面發揮多核心處理器、多路顯卡的優勢,測試成績至今仍具有重要參考意義。3DMark Vantage包括兩個圖形測試項目、兩個處理器測試項目、六個特性測試項目,還特別加入了對人工智慧(AI)和物理加速的專門測試,為玩家帶來了一場絢麗的特效盛宴。
3DMark Vantage水面渲染
3DMark Vantage還為我們帶來了很多新穎的東西,它首次把測試結果按照畫質等級預設劃分成了入門級(Entry,E)、性能級(Performance,P)、高端級(High,H)、極限級(Extreme,X)四類,測試必須嚴格運行在這四套預設模式下;測試結果得分表達方式也改成了字母加數字的組合形式,從而更細緻地反映系統性能等級,可以更對位、更公平地進行比較,省去了很多對測試結果再進行說明的麻煩。
3DMark Vantage太空場景
測試成績:
在3DMark Vantage最高難度下,各款顯卡基本都得分破萬,GTX680更是逼近兩萬分,領先HD7970大約9%,首開勝績,讓N飯忐忑的心稍稍有所平息,接下來我們看看DX11基準測試。
DX11基準性能測試:3DMark 11
3DMark 11
3DMark 11基於Futuremark自行設計的原生DX11引擎,可綜合考察DX11 PC遊戲平臺的整體圖形性能。3DMark11的主界面主要有4個選項卡,第一個為Basic,提供最通用的測試模式以及測試方式。相比Vantage版本的4種等級的測試模式,3DMark11精簡到評測環境最常用的3種,也就是我們熟悉的Entry、Performance以及Extreme,分別對應為E檔、P檔與X檔。
3DMark 11測試截圖
測試成績:
3DMARK 11測試成績(Extreme模式)
在3DMark 11測試中,GTX680顯卡得分超過3200分,領先A卡旗艦HD7970約19%,這個幅度還是蠻大的,創造出了單芯顯卡性能新高。GTX680領先GTX580也達到了55%,架構設計理念上的反思,的確讓「克卜勒」在圖形能力上受益良多。>>
《戰地3》遊戲測試:
2011年10月25日,世代DX11年度巨作《戰地3》終於正式發布,作為當前PC軍事題材射擊遊戲的兩大支柱之一,《戰地3》這次絕對沒有讓玩家失望,藉助全新開發的「寒霜2」引擎,《戰地3》對DX11提供了完美支持,遊戲中細膩的光照/粒子效果、亂真的場景渲染、大面積的物理破壞效果、暢快的射擊感受、精良的槍械手感,讓這款遊戲終於為我們展現了DX11次世代大作的震撼威力。
《戰地3》
《戰地》系列遊戲是電子娛樂巨頭EA手上的一張王牌強檔,《戰地》引擎也是業界很多遊戲的畫面支撐,此次《戰地3》採用的全新DX11「寒霜2」引擎,在3D建模精度、畫面渲染、特效呈現、物理效果等方面,都達到了當前PC遊戲的頂點水平,為次世代DX11遊戲大作樹立了一個標杆,因此成為了我們測試當前顯卡實際遊戲性能的一個重要參考。
《戰地3》室內對戰時的「電影級」光線/粒子渲染效果
在《戰地3》遊戲單人模式下,我們精選了「追獵行動」關卡來進行測試,在這個測試場景中,我們在正式進入遊戲後不進行任何操作,僅利用遊戲的自動視角「觀看」地圖,用Fraps軟體記錄這段自動視角時間內的平均幀速。
測試成績:
《戰地3》測試成績(DX11高畫質)
《戰地3》測試成績(DX11最高畫質,開啟4xAA)
在這個實際遊戲測試環節,GTX680平均領先HD7970約13%,平均領先GTX580約40%,在高解析度+最高畫質下遊戲性能也很強悍。A卡方面,GCN新架構A卡性能也顯著高於上一代產品,表現亦有突破。>>
《孤島危機2》遊戲測試:
在DX11《孤島危機2》中,玩家將再次穿上奈米生化服,並前後分別扮演CELL與Marines兩個角色,以遇襲後的紐約為遊戲背景,與神秘莫測的敵人展開新一輪高科技超限科幻戰。奈米生化服極大的強化了角色的能力,玩家因此具備隱形、護盾強化、速度強化、力量強化等各具趣味的特殊本領,在高精度建模、高質量貼圖的虛擬場景中,手持各種高科技槍械,最終完成「拯救世界」的艱巨重任。
《孤島危機2》遊戲海報
《孤島危機2》採用了第三代CryEngine引擎,強化了遊戲貼圖、人物模組、光影特效等多種遊戲表現,走在了DX11遊戲畫質的最前沿,對玩家來說,《孤島危機2》遊戲世界絕對是一場視覺風暴。
《孤島危機2》遊戲畫面
在《孤島危機2》遊戲單人模式下,我們選擇了任務模式下,「Out of the Ashes」關卡來進行測試,在這個場景測試過程中,我們在正式進入遊戲畫面後不作任何操作,僅利用遊戲的自動視角「觀看」地圖,用Fraps軟體記錄這段自動視角時間內的平均幀速。
測試成績:
《孤島危機2》測試成績(DX11 「High」畫質)
《孤島危機2》測試成績(DX11 「Very High」畫質)
在這個高難度遊戲測試環節,新的GTX680顯卡輸掉一局,測試得分落後HD7970 3幀,畫面流暢度不如後者,這也是在今天的測試中,「克卜勒」唯一輸掉的一場3D測試。究其原因,應該是DX11版高質量紋理貼圖《孤島危機2》,對顯存的要求過高,而「克卜勒」顯存位寬、顯存容量都不及HD7970。>>
《使命召喚8》遊戲測試:
《使命召喚8:現代戰爭3》由Infinity Ward製作開發,劇情緊接《使命召喚6:現代戰爭2》以及《使命召喚4:現代戰爭》,是《使命召喚》系列遊戲的又一款重磅強作,是當今玩家口碑最好的王牌FPS遊戲大作。《現代戰爭3》延續了《使命召喚》系列遊戲的優秀傳統,遊戲更注重操作手感、玩家體驗,而並不苛求硬體性能。
《使命召喚8:現代戰爭3》遊戲畫面
《現代戰爭3》依然採用DX9渲染架構,遊戲引擎源自改良後的《使命召喚4》。而且最難能可貴的是,《現代戰爭3》用並不苛求硬體性能的前提,達成了很高水準的畫面質量、特效呈現,遊戲在戰場營建、氣氛渲染上非常出色,非常值得當前主流遊戲玩家一試身手。
《使命召喚8:現代戰爭3》遊戲畫面
在《使命召喚8》遊戲中,我們選擇了第一幕「黑色星期二」關卡來進行測試,在這個測試場景中,我們在進入遊戲後不進行任何操作,僅利用遊戲的自動視角「觀看」地圖,用Fraps軟體記錄這段自動視角下的平均幀速。
測試成績:
《使命召喚8》測試成績(DX9最高畫質)
《使命召喚8》測試成績(DX9最高畫質)
在這個測試環節,克卜勒又扳回一局,測試得分領先HD7970 3-4幀,但這兩款顯卡在遊戲中的速度都已經非常流暢了,實際測試中完全感覺不到性能差異,畢竟《使命召喚》系列遊戲的設計理念不苛求硬體、更照顧普通玩家。>>
《塵埃3》遊戲測試:
《塵埃3》保持了該系列賽車遊戲專業性強、模擬度高的風格,遊戲無論在畫面還是在內容方面都比前作有了全新的進化,在畫面方面,泥漿漸漸沾染車體的設定依然保存,車身的精細程度大大強化了,新加入的雪地、山林賽道也有相對獨特的視覺效果。
《塵埃3》
本作將會有6條head-to-head賽道和32條拉力賽道,芬蘭、肯亞、挪威、密西根這幾個地點都會在遊戲中出現,福特嘉年華、福特福克斯WRC和雪鐵龍C4也會作為新車加入到遊戲中,玩家現在不但可以選擇賽車,還可以選選擇賽車,還可以選擇自己的副駕駛,感受不同的駕駛樂趣。
《塵埃3》
《塵埃3》沿襲了本系列賽車遊戲的傳統,仍然具備標準benchmark測試功能。遊戲內置的測試賽道為ASPEN的一條雪地賽道,時長大概在1分15秒,但有趣的是《塵埃3》benchmark比賽過程是隨機的,主視角的飆車成績排名會根據電腦AI發揮而隨機變化,但是測出來的FPS還算較穩定。
測試成績:
《塵埃3》測試成績(DX11高畫質)
《塵埃3》測試成績(DX11高畫質)
《塵埃3》測試對顯卡壓力也不大,但由於測試過程的隨機性,同一塊顯卡的多次測試結果會略有波動。GTX680得分領先HD7970約15%,在高解析度下領先幅度有所收斂,畢竟高解析度對顯存佔用很高。>>
Heaven Benchmark 3.0圖形測試:
最近Unigine公司發布了Heaven Benchmark 3.0版,修復了之前2.5版的一些問題,讓測試程序運行的更穩定、測試結果偏差更小,對新硬體、新系統的兼容性也更好,但遊戲測試界面、測試時長仍保持一致。
Heaven Benchmark 3.0
Heaven Benchmark主要特性為:大量使用Hardware Tessellation(硬體曲面細分)技術、支持DirectX 9/10/11和OpenGL、高級SSAO(屏幕空間環境光遮蔽)、物理學精準算法生成的容積雲、模擬光照環境變化、動態天空和光線散射、行走、飛行交互式體驗模式。
3.0版本的測試界面與前代一樣
測試成績:
Heaven Benchmark 3.0測試成績(DX11高畫質)
Heaven Benchmark 3.0測試成績(DX11高畫質)
在這個DX11關鍵性的曲面細分性能測試環節,GTX680得分仍然領先HD7970,「克卜勒」新架構在新遊戲中的表現相信也不會差。由此看來,「克卜勒」在遊戲性能上是一款有很大突破的產品,日後的主力產品也肯定能夠為玩家帶來性能升級。>>
《蝙蝠俠:阿甘之城》遊戲測試:
《蝙蝠俠:阿甘之城》仍然建立在《阿甘瘋人院》的故事上,不過這次上升至阿甘之城。高譚市內戒備森嚴的,關押了大量暴徒的監獄發生暴亂,蝙蝠俠再次出動平亂。新作還匯集了眾多明星參與的配音陣容以及蝙蝠俠中的極度兇殘的惡棍,並改進和加強了遊戲特點,讓玩家們擁有像《蝙蝠俠前傳2:黑暗騎士》一般的終極遊戲體驗。
《蝙蝠俠:阿甘之城》
《蝙蝠俠:阿甘之城》和NVIDIA合作比較深入,這款遊戲不僅支持PhysX物理加速效果,而且對NVIDIA3D眼鏡優化也很到位,在高裝備條件下,遊戲呈現出來的效果極其前衛、震撼。但這款遊戲對顯卡壓力也非常大,DX11高解析度+最高畫質下,1000元以上的顯卡才能夠跑流暢。
《蝙蝠俠:阿甘之城》
為了呈現出顯卡性能對比,我們今天的測試採用的是DX11模式,畫質設定為最高,關閉3DVision、全屏幕抗鋸齒等效果。同時,出於對A卡公平起見、更注重圖形性能,我們今天也關閉了遊戲的PhysX物理加速選項。
測試成績:
《蝙蝠俠:阿甘之城》測試成績(DX11最高畫質,關閉PhysX)
《蝙蝠俠:阿甘之城》測試成績(DX11最高畫質,關閉PhysX)
在第一個測試環節,GTX680領先HD7970為20%,第二個環節這一幅度降低到了13%,看來,在2560x1600、開啟4倍全屏抗鋸齒這樣的極限條件下,GTX680較低的顯存規格會影響性能發揮,但在較低的解析度測試條件下,顯存對顯卡的影響就很輕微。>>
《上古捲軸5:天際》遊戲測試:
《上古捲軸》遊戲系列由Bethesda Softworks遊戲製作公司所製作,自1994 年上市的「Arena」開始,目前已有五代的遊戲。Bethesda Softworks是一家美國遊戲軟體開發公司,國際著名遊戲開發商。其主要作品有:《上古捲軸》系列、《輻射3》等知名單機遊戲,其母公司是收購id software的zenimax。
《上古捲軸5:天際》遊戲
《上古捲軸》遊戲是在一個架空世界名叫Nirn的星球上,故事焦點皆在該星球裡,一個叫Temriel的帝國所發生的歷史事件。本系列遊戲強調極大的自由度,以完整的架空世界,豐富的世界設定,在眾多角色扮演遊戲裡,獨樹一幟,歷代遊戲皆獲獎無數,備受肯定。
《上古捲軸5:天際》遊戲
而且《上古捲軸》之所以能受到萬千玩家喜愛的原因,是因為在於遊戲的內容幾乎完全對玩家開放,極具擴展性,玩家可以通過各種工具對遊戲進行編輯、修改、添加內容,因此該系列遊戲也因各類MOD數量眾多而聞名,使得世界範圍內各個國家的玩家都能夠製作出自己想要的遊戲MOD並添加進遊戲當中,更有趣味性。
測試成績:
《上古捲軸5:天際》遊戲測試成績(最高畫質)
《上古捲軸5:天際》遊戲測試成績(最高畫質)
《上古捲軸》系列遊戲比較注重遊戲性、可玩性,對新硬體的優化支持比較一般。由於架構原因,高端發燒顯卡在這款遊戲中的性能也非常接近,沒有拉開明顯的差距,但總體看來,GTX680仍然獲得性能領先。>>
顯卡通用運算測試:微軟DX11 SDK流體模擬
在發布DX11之時,微軟也同時推出了專門針對開發人員的DX11 SDK(Software Development Kit, 軟體開發工具包 ),其中包括了很多DX11的應用方案和演示Demo,也有很多運用顯卡通用運算性能進行仿真模擬的物理測試。
微軟DX11 SDK
DX11 SDK中,FluidCS11是一個運用顯卡流處理器來進行流體模擬仿真的一個演示DEMO,流體的結構、流動性、反彈、碰撞模擬,會生成極大的運算數據,是顯卡通用運算性能的一個真實檢測。
微軟DX11 SDK流體模擬測試
測試成績:
在這個測試環節,GTX680、HD7970、HD7950三款2012年上市的新架構顯卡,表現出了巨大的性能優勢,流處理器運算能力比上一代產品提升一倍以上。這樣的測試成績,正是克卜勒、GCN新架構大幅提升流處理器數量的寫照。從A/N兩大陣營來看,N卡的通用運算性能又略微強於A卡,這也是N卡近三代GPU架構深耕的一個結果。>>
顯卡通用運算測試:Sisoftware GP性能測試
SiSoftware Sandra是一套功能強大的系統分析、硬體檢測、性能測試工具,擁有超過 30 種以上的分析與測試模組,對全部PC配件規格能夠做出專業檢測,對CPU、內存、硬碟、顯卡等核心配件性能能夠做出專業評判。對DIY1玩家、硬體評測網站來說,這款軟體會經常被提及。
SiSoftware Sandra
SiSoftware Sandra內部有一個GP運算性能基準測試,對顯卡通用運算性能很有參考意義。接下來我們就運用這個測試項目,來看看今天各款顯卡在通用運算中的峰值浮點運算性能表現。
SiSoftware Sandra GP運算性能基準測試
測試成績:
SiSoftware Sandra GP運算性能測試結果
我們在前文分析過,在近代的GPU架構設計上,NVIDIA與AMD的理念出現了偏差,A卡更注重於堆疊流處理器數量,以此來達成更高的指令吞吐量,HD6970具有1536個流處理器單元,HD7970更多達2048個,因此A卡峰值理論運算性能比較高,N卡在這個檢測環節不敵A卡,這也是我們後面的技術延伸閱讀部分會講到的二者在GPU架構設計上的理念分歧所致。>>
顯卡通用運算測試:Compute Mark 2.1測試
Compute Mark號稱是「第一個百分之百的DX11 Compute Shader基準測試工具」,在運算中能夠調動99%的GPU資源,CPU佔用率只有0-1%,是一款純GPU通用運算性能的檢測工具。
Compute Mark 2.1
在今天的測試中,我們的軟體選項設定如上圖所示,在這樣的設定下,大家也可以看到AMD HD7970的測試得分是6011分。下面我們看看今天各款顯卡的測試成績。
Compute Mark 2.1測試界面
測試成績:
Compute Mark 2.1測試成績
在這個通用運算性能測試環節,「克卜勒」新架構性能比上一代「費米」有顯著加強,NVIDIA的通用運算仍然在「克卜勒」身上得到傳承、發揚。另外我們也可以看到,GTX680得分略低於HD7970,AMD GCN架構在通用運算上的確發力了,AMD這樣的結構理念轉變,正是對GPU通用運算趨勢的一種認可。>>
溫度與功耗測試:
在測試之前需要說明的一點是,由於我們無法測試單張顯卡的獨立功耗,因此在測試中所有的功耗成績均為整機功耗,測試頻率均為默認頻率。我們採用高負荷FurMark進行烤機測試,5分鐘後記錄核心滿載時的溫度;然後待機10分鐘,在GPU-Z的Sensor功能記錄此時為待機核心溫度。在兩個測試環境下我們都使用功耗測試儀來檢測功耗,測試環境室溫約為18攝氏度。
最新版本Furmark
滿荷載測試界面
新版本的Furmark支持多卡互聯,並且加入了防GTX500系列顯卡智能節電的功能,為我們的滿載功耗測試提供了一個公平公正的穩定性測試環境。
測試成績:
各款顯卡溫度測試(室溫20攝氏度)
在待機狀態下,各款顯卡都會降頻、而且GPU負載為零,因此顯卡的穩定核心溫度都不高,開機後穩定待機溫度都在27攝氏度左右。GTX680散熱器體質很一般,但其功率消耗也已經比前代大大改善,因此在滿載烤機時,核心最高溫度維持在81攝氏度,還算安全。A卡HD7970 TDP功耗250W,但由於配備了真空腔均熱板散熱器,因此最高溫度也只達到81攝氏度。N卡上一代「電老虎」GTX580就很誇張,達到了86攝氏度。
各款顯卡功耗測試
採用28納米「克卜勒」新架構的GTX680,核心頻率高達1058MHz,但在節能方面卻亮點卓著,349W的整機功耗,比HD7970低了41W,對電源要求大大降低,N卡旗艦終於在功耗上優於對手,這是A/N三代架構對比上的首次反超。由此可見,「克卜勒」雖然比對手晚了三個月發布,但卻帶來了高性能、低功耗特性,更加符合時下趨勢,是一代有全面突破的新架構。>>
測試結果這樣看更簡單:
接下來,為了給大家提供一個清晰、準確的性能感受,我們將今天的測試數據進行了一番處理、編進了下面的表格,並給出了清晰的性能對比幅度。先來看看GTX680與HD7970的PK。
GTX680 VS HD7970 | ||||
測試項目 | 測試模式 | GTX680 | HD7970 | 提升幅度 |
DX9性能測試 | ||||
使命召喚8 | 1920x1080 4AA 最高畫質 | 134 | 130 | 3.08% |
2560x1600 4AA 最高畫質 | 93 | 90 | 3.33% | |
上古捲軸5:天際 | 1920x1080 4AA 最高畫質 | 62 | 60 | 3.33% |
2560x1600 4AA 最高畫質 | 56 | 55 | 1.82% | |
3DMark Vantage | Extreme模式 | 19369 | 17777 | 8.96% |
DX11性能測試 | ||||
3DMark11 | X模式 | 3270 | 2744 | 19.17% |
1920x1080 4AA 高畫質 | 72 | 67 | 7.46% | |
2560x1600 4AA 高畫質 | 45 | 43 | 4.65% | |
戰地3 | 1920x1080 4AA 最高畫質 | 82 | 69 | 18.84% |
2560x1600 4AA 最高畫質 | 45 | 41 | 9.76% | |
塵埃3 | 1920x1080 4AA 高畫質 | 198 | 157 | 26.11% |
2560x1600 4AA 高畫質 | 132 | 116 | 13.79% | |
孤島危機2 | 1920x1080 4AA High畫質 | 43 | 46 | -6.52% |
2560x1600 4AA Very High | 24 | 27 | -11.11% | |
蝙蝠俠:阿甘之城 | 1920x1080 4AA 最高畫質 | 104 | 87 | 19.54% |
2560x1600 4AA 最高畫質 | 59 | 52 | 13.46% | |
通用運算測試 | ||||
微軟DX11 SDK | 2560x1600 最高難度,運算幀數 | 99 | 95 | 4.21% |
Sisoftware GP | —— | 760 | 2180 | -65.14% |
Compute Mark | —— | 5779 | 6011 | -3.86% |
功耗溫度測試 | ||||
溫度 | 待機 | 26 | 27 | -3.70% |
滿載 | 81 | 81 | 0 | |
功耗 | 待機 | 102 | 100 | 2.00% |
滿載 | 349 | 390 | -10.51% | |
平均提升(不包括功耗溫度和通用計算) | 1920x1080解析度 | 10.26% | ||
2560x1600解析度 | 5.10% | |||
總體分數 | 9% |
下面來看看GTX680與上一代GTX580的性能對比。
GTX680 VS GTX580 | ||||
測試項目 | 測試模式 | GTX680 | GTX580 | 提升幅度 |
DX9性能測試 | ||||
使命召喚8 | 1920x1080 4AA 最高畫質 | 134 | 111 | 20.72% |
2560x1600 4AA 最高畫質 | 93 | 68 | 36.76% | |
上古捲軸5:天際 | 1920x1080 4AA 最高畫質 | 62 | 57 | 8.77% |
2560x1600 4AA 最高畫質 | 56 | 51 | 9.80% | |
3DMark Vantage | Extreme模式 | 19369 | 13627 | 42.14% |
DX11性能測試 | ||||
3DMark11 | X模式 | 3270 | 2111 | 54.90% |
1920x1080 4AA 高畫質 | 72 | 52 | 38.46% | |
2560x1600 4AA 高畫質 | 45 | 31 | 45.16% | |
戰地3 | 1920x1080 4AA 最高畫質 | 82 | 55 | 49.09% |
2560x1600 4AA 最高畫質 | 45 | 33 | 36.36% | |
塵埃3 | 1920x1080 4AA 高畫質 | 198 | 150 | 32.00% |
2560x1600 4AA 高畫質 | 132 | 97 | 36.08% | |
孤島危機2 | 1920x1080 4AA High畫質 | 43 | 33 | 30.30% |
2560x1600 4AA Very High | 24 | 19 | 26.32% | |
蝙蝠俠:阿甘之城 | 1920x1080 4AA 最高畫質 | 104 | 78 | 33.33% |
2560x1600 4AA 最高畫質 | 59 | 46 | 28.26% | |
通用運算測試 | ||||
微軟DX11 SDK | 2560x1600 最高難度,運算幀數 | 99 | 39 | 153.85% |
Sisoftware GP | —— | 760 | 677 | 12.26% |
Compute Mark | —— | 5779 | 3676 | 57.21% |
功耗溫度測試 | ||||
溫度 | 待機 | 26 | 26 | 0 |
滿載 | 81 | 86 | -5.81% | |
功耗 | 待機 | 102 | 107 | -4.67% |
滿載 | 349 | 461 | -24.30% | |
平均提升(不包括功耗溫度和通用計算) | 1920x1080解析度 | 30.38% | ||
2560x1600解析度 | 31.25% | |||
總體分數 | 33.03% |
接下來看看GTX680與經典中端顯卡GTX560Ti的對比。
GTX680 VS GTX560Ti | ||||
測試項目 | 測試模式 | GTX680 | GTX560 Ti | 提升幅度 |
DX9性能測試 | ||||
使命召喚8 | 1920x1080 4AA 最高畫質 | 134 | 85 | 57.65% |
2560x1600 4AA 最高畫質 | 93 | 49 | 89.80% | |
上古捲軸5:天際 | 1920x1080 4AA 最高畫質 | 62 | 45 | 37.78% |
2560x1600 4AA 最高畫質 | 56 | 38 | 47.37% | |
3DMark Vantage | Extreme模式 | 19369 | 9693 | 99.82% |
DX11性能測試 | ||||
3DMark11 | X模式 | 3270 | 1513 | 116.13% |
1920x1080 4AA 高畫質 | 72 | 30 | 140.00% | |
2560x1600 4AA 高畫質 | 45 | 19 | 136.84% | |
戰地3 | 1920x1080 4AA 最高畫質 | 82 | 40 | 105.00% |
2560x1600 4AA 最高畫質 | 45 | 24 | 87.50% | |
塵埃3 | 1920x1080 4AA 高畫質 | 198 | 114 | 73.68% |
2560x1600 4AA 高畫質 | 132 | 72 | 83.33% | |
孤島危機2 | 1920x1080 4AA High畫質 | 43 | 23 | 86.96% |
2560x1600 4AA Very High | 24 | 13 | 84.62% | |
蝙蝠俠:阿甘之城 | 1920x1080 4AA 最高畫質 | 104 | 47 | 121.28% |
2560x1600 4AA 最高畫質 | 59 | 27 | 118.52% | |
通用運算測試 | ||||
微軟DX11 SDK | 2560x1600 最高難度,運算幀數 | 99 | 26 | 280.77% |
Sisoftware GP | —— | 760 | 437 | 73.91% |
Compute Mark | —— | 5779 | 2785 | 107.50% |
功耗溫度測試 | ||||
溫度 | 待機 | 26 | 26 | 0 |
滿載 | 81 | 77 | 5.19% | |
功耗 | 待機 | 102 | 106 | -3.77% |
滿載 | 349 | 356 | -1.97% | |
平均提升(不包括功耗溫度和通用計算) | 1920x1080解析度 | 88.91% | ||
2560x1600解析度 | 92.57% | |||
總體分數 | 92.89% |
從上面的測試結果可以看到,GTX680平均性能超過HD7970約9%,在個別項目中最大領先福度甚至超過20%,在8個圖形測試項目中,有7項獲得領先。由此可見,「克卜勒」架構GTX680顯卡的遊戲性能確實比對手有優勢,而且這個優勢幅度並不太容易被反超,從下圖可以看出,HD7970超頻到1125MHz,3DMark 11得分也只有3148分,仍然無法追及GTX680。
超頻到1125MHz核心頻率,HD7970 3DMark11跑分仍不及GTX680
經過測試我們發現,較低的顯存規格是「克卜勒」的最大軟肋,在上面表格2560x1600解析度、開啟4倍全屏抗鋸齒條件下的7項圖3D測試中,GTX680平均僅領先HD7970約5%,低於9%的整體水平。這是因為:在高解析度、全屏抗鋸齒畫質下,遊戲紋理渲染非常吃顯存,對GTX680的頂級性能來說,256bit顯存位寬、2GB顯存容量的「中端」規格已經顯露疲態。
兩款旗艦顯卡測試成績直觀圖
另外,在上面的測試成績直觀圖上,我們也可以看出:在3DMark系列跑分測試環節,GTX680平均領先HD7970約14%,在7項3D遊戲性能測試環節,GTX680平均領先HD7970約8%,在微軟DX11 SDK通用運算環節,GTX680領先HD7970約4%,由此看來,與對手的GCN架構相比,「克卜勒」圖形性能領先幅度更大,通用運算性能則正在被趕上。>>
PConline評測室總結:
我們將這次參與評測的顯卡在不同項目下的測試結果以GTX560Ti為基準進行對比,取其平均值,得出以下圖表:
1920x1080解析度下各顯卡的綜合性能比較
2560x1600解析度下各顯卡綜合性能比較
經過前面的產品認識、性能測試、數據處理,一個完整的「克卜勒」印象已經完整呈現出來了,我們可以這樣來理解:今天的這款GTX680顯卡是計算機圖形晶片巨頭NVIDIA的新一代旗艦產品、是當前性能最強大的單芯遊戲顯卡、是一款在性能/功耗上都有真正突破的產品。NVIDIA藉助GTX680顯卡實現了架構理念和產品策略的雙重轉變,這必然會對今後的顯卡發展產生轉折性的影響。
GTX680:NVIDIA GPU架構設計理念和「小晶片」產品策略的雙重轉變
這種轉折首先就是:NVIDIA不再用「純通用運算處理器」理念來設計GPU了,通用運算仍然是GPU的未來,但更強大的圖形/遊戲性能卻是玩家渴求的現實。因此,這次的「克卜勒」新架構做出了加強圖形性能、繼承通用運算的理念轉變,讓今天的這款GTX680顯卡遊戲性能達到了上一代GTX580的1.5倍,向業界交出了一份出色的答卷。
NVIDIA GeForce GTX680顯卡
GTX680顯卡的另一層意義就是:NVIDIA藉此正式開啟了「小晶片」策略,讓N卡設計思路歸於高性能、低功耗正途,旗艦顯卡不再是「電老虎」,前幾代能「煎雞蛋」的巨型GPU晶片策略終於走到了盡頭。所以可以說GTX680是一款真正有設計突破的產品,更符合時下的「高能效」綠色潮流。
GTX680是一款有「驚喜」的產品:
在2012年的新一代顯卡大戰中,NVIDIA GTX680比競爭對手的HD7970晚了近三個月,在對手實力已經透明的情況下,業界普遍期望NVIDIA能夠更給力、給大家帶來一場驚喜。那麼怎樣才算「驚喜」呢?我認為就是性能更強、功耗更低,現在看來,GTX680在這兩方面都做到了,它平均遊戲性能高出HD7970約8%,跑分性能更是高出14%,讓後者已經很難通過超頻追及。
GTX680與HD7970的測試成績直觀圖
而功耗方面,GTX680顯卡配合當前最高端的Intel CPU平臺,主機在遊戲時的功耗還不足350W,對電源的要求大大降低,比對手的HD7970顯卡省電40多瓦,實現了近三代架構上的首次反超,成功走上高能效之路。
GTX680對行業的意義:
通過對上一代「費米」架構的反思,在2012年的新一代顯卡上,NVIDIA/AMD的GPU晶片架構理念又走向一致,今後的顯卡,「高能效」將會是發展主線,「電老虎」顯卡將有望被徹底拋棄。而且兩家晶片巨頭在設計理念上的「相互借鑑」,也將使顯卡從核心晶片就走向「同質化」,未來不同陣營顯卡之間將日益只剩下性能競爭。
NVIDIA GeForce GTX 680 圖片 評測 論壇 報價
另外,隨著NVIDIA/AMD新架構顯卡競相降低功耗,以往依賴發燒顯卡生存的大功率電源也必然會受到影響,促使顯卡行業重新回歸到注重能耗比的時代,至少能暫時告別高發熱、高功耗的顯卡時代。
GTX680顯卡選購建議:
今年1月份AMD發布HD7970時,很多玩家都是一種觀望心態,希望看到NVIDIA「克卜勒」後再做選購決定。現在,GTX680並沒有讓玩家失望,對於預算充足的頂級發燒玩家來說,現在已經可以考慮入手了,畢竟指望頂級顯卡降價是不現實的。對於普通玩家來說,大家可以繼續等待「克卜勒」新架構的中、低端產品,新架構的高能效特性,遠比上一代顯卡更值得我們入手。
NVIDIA GTX680顯卡評測部分完結。如果您想了解NVIDIA此次發布的「克卜勒」晶片架構的更多技術信息,請點擊這裡繼續閱讀後文。>>
23日已同步上市的GTX680顯卡一覽:
此次NVIDIA發布GTX680時,N卡合作夥伴映眾、索泰、七彩虹、影馳等顯卡廠商也同步推出了GTX680顯卡,這些3月23日首批開售的顯卡全部都是公版顯卡,它們的外觀造型、做工用料、性能表現與我們前面測試使用的顯卡完全一致,不同的只是各顯卡廠商的品牌形象和質保政策。
映眾GTX680顯卡賞析:
映眾GTX680顯卡
映眾GTX680顯卡
影馳GTX680顯卡賞析:
影馳GTX680顯卡
影馳GTX680顯卡
七彩虹GTX680顯卡賞析:
七彩虹GTX680顯卡
七彩虹GTX680顯卡
索泰GTX680顯卡賞析:
索泰GTX680顯卡
索泰GTX680顯卡
電腦賣場已經做好了開售準備:
23日一早,廣州的電腦城賣場已經開始全面上架GTX680新顯卡,玩家今天就可以在電腦買到與NVIDIA同步首發的各大品牌GTX680顯卡了。
映眾的GTX 680外觀以橙黑為主
七彩虹貨源充足
索泰的GTX680採用索泰特色的橙黑外觀
耕升的680品牌特色鮮明
「克卜勒」的改變(1):28納米工藝,1GHz以上動態頻率
「克卜勒」架構首款旗艦晶片「GK104」顯卡的正式名稱是GeForce GTX680。GK104晶片採用臺積電28納米製程生產,但電晶體蝕刻工藝與第一款試水28納米的AMD「Tahiti」晶片又有所不同,「Tahiti」晶片去年就已經開始量產,當時臺積電手下能夠滿足AMD需求的只有28nm HKMG HPL方案,這也是一種高K金屬柵極技術,在提升運行頻率與防漏電低功耗之間能夠獲得較好的均衡,晶片良品率也比較高。
臺積電28納米矽晶圓
而比「Tahiti」晚了三個月的GK104晶片,使用的是後來才成熟的28nm HKMG HP高性能工藝,這種工藝能夠達成更高的核心運行頻率,因此「克卜勒」架構旗艦顯卡GTX680的發布時的核心頻率就已經在1058MHz了,創下了A/N公版顯卡頻率之最。日後簡化版輕裝上陣的中低端「克卜勒」晶片(GK107),將肯定能夠爆出更誇張的運行頻率。
「克卜勒」諜照(上圖):NVIDIA GK104與AMD Tahiti晶片對比
NVIDIA在GTX680身上還加入了另一項新特性:Boost動態頻率,讓顯卡滿載時的核心頻率可以在1006-1058MHz之間動態調整,從而進一步提升顯卡峰值性能,而且能夠實現滿載節能。動態頻率設計在CPU上已經被普遍使用,比如Intel Core處理器的「睿頻」技術,但在顯卡上「克卜勒」尚屬首次,儘管頻率動態調整的幅度只有50多MHz。
「克卜勒」的改變(2):256bit顯存,改進的顯存控制器:
GTX680顯卡採用256bit顯存控制器,這比GTX580「縮水」不少。在對手的這代HD7970都已經升級到384bit顯存位寬的情況下,NVIDIA卻降至256bit顯存位寬,這能否滿足「克卜勒」的性能需求?
「克卜勒」只有8顆顯存晶片,的確是256bit顯存位寬設計
在前幾代產品中,顯存控制器一直是A卡的優勢,N卡顯存頻率最高也只達到了4100MHz。但GTX680的等效顯存頻率達到了創紀錄的6008MHz,超過了HD7970 5500MHz的水準,NVIDIA終於在顯存頻率方面爆發了。GTX680顯卡標配2GB顯存,比GTX580 1.5GB的容量有了提升,雖不及HD7970的3GB來的「海量」,但估計二者不會因為顯存容量造成性能差距,而且2GB顯存,對付未來兩三年的遊戲也都仍然是綽綽有餘了。
「克卜勒」在顯存頻率上爆發了
高頻率的確可以彌補較低的顯存位寬的缺陷,但NVIDIA自減顯存位寬的做法,仍然讓玩家不太好接受。但GK104畢竟是一款「小晶片」,日後的旗艦級「克卜勒」:GK110晶片,將有望採用更強大的顯存位寬設計。
「克卜勒」的改變(3):三倍於GTX580的流處理器數量,放棄Shader分頻設計
從2007年的GeForce 8系列顯卡開始,NVIDIA GPU晶片內部的Shader著色器運行頻率就一直數倍於核心頻率,上一代「費米」架構採用的是雙倍方案,比如GTX580核心頻率772MHz,但Shader著色器頻率為兩倍的1544MHz,更高的Shader頻率,可以幫助以「通用運算」為設計理念的GPU晶片提升圖形渲染性能,這也是NVIDIA「通用運算是未來」這一架構設計理念下,同時也重視遊戲性能的一種表現。
GTX580的Shader著色器頻率兩倍於核心頻率
但Shader分頻設計是一把雙刃劍,會顯著增加GPU為架構設計的複雜度、加大晶片發熱量。NVIDIA這次發布的「克卜勒」新架構,伴隨著對「費米」純通用運算架構GPU設計理念的反思,已經開始著手提升當前玩家呼聲更高的遊戲圖形性能,因此,GTX680內建了1536個流處理器,是上一代GTX580的三倍。
GTX680放棄高能耗Shader分頻設計,因此核心僅需4相供電
因此可以說,雖然Shader分頻設計有著巨大的性能誘惑,但「克卜勒」還是放棄了這一設計方案,而是用更多的流處理器、優化過的圖形性能,來代替這一方案,而且顯著地降低顯卡功耗,並且讓「克卜勒」能夠實現「小晶片」策略。
「克卜勒」的改變(4):GTX680 TDP功耗降至195W,功耗首次優於對手
GTX680採用6pin+6pin外接供電設計,TDP功耗195W
GTX680放棄了高能耗Shader分頻設計,但卻獲得了巨大的功耗改進,從而順利開啟了「小晶片」戰略,實現了一次讓業界出乎意料的反擊。NVIDIA這次推出的公版GTX680顯卡,僅採用6pin+6pin外接供電設計設計,與上一代千元級中端顯卡一樣。GTX680最大峰值功耗降至195W,這在近幾代旗艦卡中是一項了不起的成就,發燒級顯卡終於不再「體溫發燒」。
AMD HD7970採用6pin+8pin外接供電設計,TDP功耗280W
而AMD HD7970顯卡需要採用6pin+8pin外接供電設計,TDP功耗250W。N卡旗艦終於在功耗上優於對手,這是A/N三代架構對比上的首次反超。由此可見,「克卜勒」雖然比對手玩了三個月發布,但卻帶來了更性能、低功耗特性,更加符合時下趨勢,是一代有全面突破的新架構。
「克卜勒」的改變(5):支持4屏顯示
長久以來,N卡都只支持雙屏輸出,一張顯卡最多只能連接兩臺顯示器。而競爭對手方面,AMD上一代顯卡就已經可以支持六屏輸出,在這樣的情況下,A卡的多屏輸出功能就成了對手的一個攻擊點。在這次新發布的「克卜勒」架構上,NVIDIA終於為我們帶來了改變,GTX680顯卡能夠利用4個輸出接口實現4屏輸出。
GTX680顯卡支持4屏輸出
這4個屏幕即可以互相獨立,又可以將其中的三個組合成一個超寬的「三聯屏」,從而實現超寬視野遊戲效果,而第四個屏幕可以用於上網、辦公,遊戲/溝通兩不誤。
「克卜勒」的改變(6):高效能TXAA抗鋸齒功能
在這次的GTX680發布上,NVIDIA 提到了一個名為TXAA的抗鋸齒技術,它有兩種模式:TXAA1和TXAA2,專門用於結合「克卜勒」新顯卡的紋理單元特性,達到高圖像質量、低性能損失效果。
TXAA與MSAA的對應關係
NVIDIA宣稱TXAA1能夠能夠以2xMSAA的性能損失,達成8xMSAA的畫面質量。但NVIDIA並未向業界深入講解TXAA的技術特性、實現方法,也未提供掩飾demo,因此這一項新特性還有待於我們深入認識。
8xMSAA與TXAA抗鋸齒效果對比
NVIDIA透露下半年業界將會有多款知名遊戲支持TXAA技術,虛幻4引擎以及BitSquid、Slant Six Games、Crytek等開發小組也將加入到新技術支持中來,到時候我們再做解析。
「克卜勒」的改變(7):支持微軟DX11.1標準
DirectX(簡寫DX)11.1支持與PCI-E 3.0接口。DirectX API是微軟發布的遊戲接口,可以看作是一個遊戲渲染技術/建模技術的匯集,微軟藉助DirectX API規範,控制著PC遊戲/顯卡硬體行業,每代DX版本的更新,都會引起顯卡行業的更新換代、巨頭角力、甚至驚濤駭浪。當前,Windows XP平臺上一般運行的是DX9.0c,而Windows 7平臺上則運行的是DX11,預計2012年底Windows 8正式版發布後,將會為玩家普及DX11.1標準。
DX11曲面細分技術實際遊戲畫面(Crysis 2)
DX11.1最大的改進就是將3D立體顯示技術正式寫入了D3D API,讓開發者可以通過D3D渲染實現3D顯示,而不再像之前一樣需要繞過D3D API而使用四倍緩衝器或驅動/中間件來實現的。在DX11.1中,3D立體顯示技術將成為成為一種通用標準,遊戲開發也將更加簡單。但PC 3D顯示技術當前遠未步入普及階段,畢竟這還需要克服顯示器、3D眼鏡等一大堆難題。
電腦3D顯示技術要想普及,還需要克服顯示器、3D眼鏡等一大堆難題
DX11.1還支持TIR目標獨立光柵化技術,優化了GPU雙精度浮點運算效率,增強了圖形與視頻之間的操作靈活性,但這都只是一些小修小補的版本修訂,基本無關遊戲性能痛癢,但也正因為如此,為新一代顯卡帶來DX11.1支持並不存在什麼難度。
Win8正式版將會支持DX11.1規範
在DX版本支持問題上,顯卡廠商都大意不得。這次發布的「克卜勒」已經對DX11.1提供了全面支持,畢竟NVIDIA本身就是電腦3D顯示技術的先行者,在過去的三年時間內已經推出了兩代3D眼鏡產品,DX11.1將3D遊戲開發接口標準化,更是正中NVIDIA下懷。>>
NVIDIA「克卜勒」顯卡的前世今生
說到「克卜勒」的由來,時間要回到2006年底GeForce 8800GTX發布的時代,從那時開始,NVIDIA就喜歡用著名科學家的名字作為自己顯卡「架構」的代號,從Tesla(特斯拉)、Fermi(費米)、Kepler(克卜勒)到Maxwell(麥克斯韋)。
每一個代號代表一次重大的產品更新,2012年是「克卜勒」新架構顯卡,到2013-2014年,就會迎來下一代的「麥克斯韋」。所以,要追溯「克卜勒」顯卡的前世,就必須從Tesla(代號也叫G80)說起,因為從那時起,遊戲顯卡開始不單單只是遊戲顯卡了,還支持通用計算。
NVIDIA近年來的架構變化 | ||||
發布年份 | 產品系列 | 核心代號 | 核心命名 | |
2006.11 | GeForce 8 | G8x | Tesla(特斯拉) | |
2008.02 | GeForce 9 | G9x | Tesla(特斯拉) | |
2009.01 | GeForce 100 | G9x | Tesla(特斯拉) | |
2008.06 | GeForce 200 | G2xx | Tesla(特斯拉) | |
2009.11 | GeForce 300 | G21x | Tesla(特斯拉) | |
2010.03 | GeForce 400 | GF10x | Fermi(費米) | |
2010.11 | GeForce 500 | GF11x | Fermi(費米) | |
2012.03 | GeForce 600 | GK10x | Kepler(克卜勒) |
GPU通用運算邁出的第一步:G80 Tesla架構
那是2006年,DX10時代開始,GPU設計開始轉向統一渲染架構,顯卡架構上相比以前有了翻天覆地的變化,GPU流處理器成為新的性能標杆,也宣告遊戲顯卡進入通用計算的時代。這場戰鬥,NVIDIA首先推出了G80架構(Telsa)的GeForce 8系列顯卡,首次支持CUDA技術,可進行通用計算。
在DX10統一渲染架構下,顯卡拋棄了以前傳統的渲染管線,取而代之的是統一的流處理器。2006年11月,NVIDIA推出了完全基於DX10 API開發的圖形處理器架構——G80,之後的旗艦產品是GeForce 8800 Ultra。
相信很多人都聽說過「孤島危機」這款遊戲,作為首批支持DX10的遊戲大作之一,「孤島危機」為玩家帶來了以前想都不敢想的物理特效,G80完全基於DX10 API開發,自然也能全面支持各種絢麗的DX10特效;當然,對於NVIDIA來說,G80的誕生還有更加深遠的意義。
DX10為玩家帶來了絢麗的遊戲畫面
從G80開始,遊戲顯卡不只是為了玩遊戲,還能支持通用計算。所謂通用計算的大體流程就是:待處理的數據→轉換成圖形數據→GPU處理→處理後的圖形數據→轉換成所需數據。簡單點說就是把數據轉換為GPU能夠「看懂」的圖形數據,利用GPU強大的浮點運算能力減輕CPU的負擔。DX10的出現大大降低了通用計算的實現難度,而CUDA的出現則解決了應用層面的問題。
G80開啟NV的CUDA與通用計算時代:
通用計算就是讓GPU幫CPU處理數據
隨著G80的發布,NVIDIA藉機提出了經過多年籌劃的CUDA通用計算架構。CUDA架構是第一個面向GPU的軟硬體結合通用處理解決方案,它的指令集架構能夠讓開發人員繞開傳統的圖形API而直接訪問GPU硬體,還包含了一個全新的C語言編譯器,開發人員可以用常見的C語言來為GPU編寫程序,編程效率成倍提高。有了CUDA,我們就能輕鬆享受到GPU通用計算帶來的各種硬體加速功能,在某些計算密集型領域,GPU通用計算能帶來數十甚至上百倍的運算性能提升。
CUDA橫空出世
反觀AMD-ATI(那時候ATI還未完全併入AMD,ATI品牌依然存在),只是在舊有架構上進行升級,稱之為「超標量體系」,通用計算並未引起AMD-ATI足夠重視。在DX10的第一個回合較量裡,對比AMD-ATI當時的HD2000系列,NVIDIA取得了全面勝利。
後來AMD改進版的HD3000也無力回天,應對NVIDIA經典的G92系列,8800GT、9800GT等仍處於下風,AMD-ATI顯得相當被動。
通用計算性能大幅強化,第二代TESLA架構
2008年,NVIDIA將Tesla架構升級到GT200核心,即第二代Tesla架構,和上代的G80/G92相比,幾乎所有的微架構都作了調整,並大幅擴充規模,NVIDIA的目標很明確——進軍高性能計算領域,走通用計算的道路 。桌面平臺的代表產品是NVIDIA GTX 280。
GT200時期的代表作——NVIDIA GTX 280
我國自行研製的超級計算機「天河一號」採用了TESLA核心
在硬體規格上GTX280幾乎上上一代旗艦GeForce 8800 Ultra的兩倍,在大幅度強化通用計算能力的同時,遊戲性能的提升也是顯而易見的,有數據顯示,GTX280的遊戲性能比8800Ultra高出50%
另一方面,由於理念不同,AMD並沒有把注意力放在通用計算上,走的道路和DX9時代相似——主打「遊戲顯卡」概念,RV770-RV870都是通過擴充流處理器來提高運算能力,此時AMD也意識到通用計算的重要性,推廣自家的Stream通用計算技術。
AMD的HD4800系列曾經輝煌過
這一舉措讓AMD的HD4800大獲成功!同時NVIDIA的GTX200系列顯卡高功耗的弊端開始顯露,性價比完全被HD4800壓制。幸好後來有55nm技術補救,讓NVIDIA在2009年上半年挽回劣勢。但是NVIDIA沒有吸取教訓,下面的「費米」功耗問題到達了頂峰。>>
「克卜勒」顯卡第二步:費米
NVIDIA將2010年的GTX400系列顯卡新架構命名為「費米」,是第二款以大物理學家命名的產品,通用運算理念再一次得到進化。後來的事實也證明,Fermi確實是NVIDIA最得意之作,甚至連對手AMD今年新推出的「GCN」架構也借鑑了不少「費米」的通用運算理念,這點我們後文再細說。
DX11與並行運算的結合:「費米」架構簡析
2010年,NVIDIA聲稱Fermi GF100是一個全新架構並非沒有道理。幾乎每一個原有模塊都進行了重組:有的砍掉了,有的轉移了,有的增強了,還新增了光柵引擎和多形體引擎。完整的GF100核心總共有16組SM,每一組SM包含32個CUDA核心,ROP單元總共48個,分為六組,分別搭配一個64-bit顯存通道。所有ROP單元和整個晶片共享768KB二級緩存(GT200裡是獨享)。
完整的GF100核心架構
「費米」架構GF100晶片內建512個流處理器,NVIDIA將之稱作「CUDA核心」,這512個核心分為16組SM單元,每組SM單元包含32個CUDA核心,核心電晶體數量達到了30億個。設計如此大規模的GPU,在當時是一件近乎不可能的事情,因此「費米」晶片良品率低、功耗巨大。NVIDIA被迫在當時的旗艦GTX480顯卡上,屏蔽了32個CUDA核心,但GTX480的性能依然達到了新高。
「費米」架構SM單元結構圖
DX11一個很重要的特點就是細分曲面,細分曲面把遊戲畫面切割成更小的三角形,這樣使得整個畫面更加逼真細膩,而細分曲面的實現則需要用到多形體引擎,多形體引擎的數量也直接關係到顯卡在DX11遊戲中的表現。
「費米」的變化:通用運算是基礎,也更適應DX11新特性
GF110晶片與之前的GT200晶片在核心架構上有巨大的不同,「費米」加入多形體引擎以更適應DX11顯卡的要求。多形體引擎負責頂點拾取、細分曲面、視口轉換、屬性設定、流輸出等五個方面的處理工作,以符合DX11中最重要的曲面細分(Tessellator)特性。GF100中有16個多形體引擎,每組SM一個。
「費米」第一代成品:GTX480規格
NVIDIA在GPU架構設計部分很出色,但是NVIDIA在晶片製造端掉了鏈子——由於GPU核心太大,臺積電40nm工藝還不夠成熟,導致GF100核心良品率低下,沒能達到設計預期,最終的產品不僅功耗發熱很大,而且規格不完整,外界對GTX480顯卡的評價不是很高,讓對手找到了攻擊點。
Barts核心和Cayman核心:AMD開始做出改變
這時候AMD已經意識到自己走錯了路子,開始尋找挽救的方法,繼續小核心策略。2010年底,AMD發布HD6800系列,超線程分配處理器從一個變成兩個。SIMD的缺點就是流處理器執行效率比MIMD架構低,其效率高低完全依賴於分配單元的派發效率。因此Barts這種雙線程分配處理器的設計意義重大,可以有效地提高SIMD執行效率。到了HD6900核心則更進一步,圖形引擎也變成了兩個,進一步提升性能。
HD6870顯著提升了曲面細分性能
根據AMD官方提供的數據來看,HD6870的曲面細分性能最多可達HD5870的兩倍,這種情況出現在10級左右的中等細分程度,當曲面細分達到20級以上的時候,Tessellator本身的運算能力將成為瓶頸,此時線程派遣器的效率再高,也無濟於事。
「費米」最終成品:上一代「制高點」GTX580顯卡
由此可見,AMD HD6800核心和HD6900核心的改進都是治標不治本,AMD如果不改變SIMD架構很難再有新的突破。NVIDIA GF100核心的架構是相當強大的,等到工藝成熟之後的GF110核心(GTX580顯卡),就又站在了遊戲與通用計算的性能之巔。
「費米」這代的競爭,NVIDIA先輸了上半場,下半場漂亮地反擊。
插曲:AMD GCN架構
前面我們已經指出AMD歷代GPU的瓶頸除了曲面細分以外,其實最重要的是SIMD超長指令集架構的效率問題,GCN架構的出現彌補了這一遺憾。2012年,AMD終於放棄沿用了5年的SIMD架構,借鑑NVIDIA的「通用運算」理念,將內部重新規劃,設計出了GCN架構(次世代圖形核心),首款旗艦產品正是1月9日發布的代號Tahiti的HD7970。
2012年1月9日,AMD推出GCN新架構,由此融入高性能運算潮流
事實上,HD7970的GCN架構改變了AMD自R600以來一直堅持的VLIW打包吞吐模式,這個改動可以說徹底撼動了AMD GPU構架發展的基礎。VLIW(超長指令字)是將很多條指令連在一起,建成一個超長指令,讓GPU的運算單元可以一次啟動連續執行,省去了很多調度指令、等待周期,從而提升運算效率,單線程執行密度很高。但VLIW在多個流處理器並行性上存在一些難以預料的指令打包、分派靈活性邏輯缺陷,在GPU這樣規模越來越大的並行處理器上,數千個流處理器的整體吞吐率反而受到影響。
GCN駕架構:為高性能運算優化
DirectX 11要求構架擁有更好的ALU靈活度和通用計算能力,而非傳統意義上的單純吞吐能力。VLIW模式高吞吐低靈活性的特點,在通用計算就是圖形計算的今天已經顯得有些呆板了。GCN架構的出現,正是AMD在意識到需要加強通用計算性能來獲取更好的圖形表現之後所做出的重大轉變,放棄VLIW不僅意味著GPU領域超長指令與普通指令分庭抗禮時代的終結,普通SIMD吞吐模式統一江湖,更標誌著AMD正式「重歸」GPU高性能計算應用領域。
HD7970的「GCN」結構示意圖
因此,在設計理念上,GCN架構已經不再單純的追求圖形渲染能力,而是更注重於為高性能運算優化,這個理念轉變,更符合「通用計算就是圖形計算」的今後趨勢。GCN架構正是AMD加強通用計算性能思路的表現,而且高性能通用計算也能同時帶來更高的圖形性能。放棄VLIW不僅意味著GPU大規模並行框架內普通SIMD指令模式的回歸,更標誌著AMD理念轉向GPU高性能計算。
完整的GCN架構(居中的是32個並行計算單元)
HD7970架構中的2048個流處理器組成了32個並行計算單元,如此一來,每個計算單元內部就具有64個流處理器,這64個流處理器組成了4個矢量單元(Vector Unit),每個矢量單元搭配64KB矢量寄存器。GCN架構內,每4個計算單元組成一個運算小組,配備了數據寄存器和一些輔助性功能模塊,從而組成了一個完整的運算中樞(類似於一個純計算功用的核心集群)。
GCN計算單元結構示意圖
GCN架構中的這些計算單元,是基於SIMD普通指令集的結構模式,拋棄了以往的VLIW(超長指令字)的打包吞吐模式,單個計算單元靈活度、獨立性更高,每個計算單元都能同時領取、執行指令,眾多計算單元並行處理能力很高,架構利用率和指令吞吐量比VLIW模式更高。GCN架構下,HD7970的理論運算能力相比HD6970提升不過40%,但在GPU通用計算當中的性能提升卻非常顯著,普遍可達兩倍以上,尤其在AES加密解密算法中,速度達到了前者的4倍。
GCN架構讓AMD信心飽滿
NVIDIA從G80開始放棄SIMD架構,革命性地設計了MIMD,歷經5年市場考驗進化到「費米」,是一個很成功的設計方案,AMD借鑑了NVIDIA的成功方案,師夷長技以制夷,完成了一次華麗的轉身反擊,HD7970一發布,就拿下「單芯卡王」的寶座。由此開始,從「通用運算是未來」的設計理念出發,AMD、NVIDIA圖形晶片為架構設計又歸於相似。>>
第三步:「克卜勒」登場
NVIDIA這次發布的「克卜勒」架構GK104晶片,流處理器數量1536個,達到了上一代旗艦GTX580的三倍,如此激進,令人始料未及。晶片集成了35億個電晶體,核心面積卻僅僅294平方毫米,TDP功耗更降到了195W,只是GTX580的一半稍多。由此看來,「克卜勒」與「費米」在架構上有巨大的不同,明顯更高效、更節能。
「克卜勒」架構GK104晶片核心圖
GK104晶片內建的1536個CUDA流處理器,被分配成16組SM陣列,每組SM包含96個流處理器,接下來的GTX660、GTX650、GTX620...流處理器數量都有可能會比上代產品至少翻一倍。在核心規模上,GK104比GF110複雜很多,但藉助28納米工藝,GK104晶片核心面積只有294平方毫米,遠遠小於GF110 520平方毫米的規模,也小於對手HD7970的365平方毫米。
GK104晶片內部結構圖
GK104晶片的電晶體數量是35億個,比GF110晶片30億個的規模高不了多少,這就又產生了一個很的疑問:三倍的流處理器「建築」規模,卻只多用了1/6的電晶體「磚頭」,NVIDIA是如何做到的?
GF110晶片結構圖
正如大家所想,GK104採用了一種「簡化CUDA核心」的設計方案。GK104的1536個流處理器,被劃分為8個SM單元,每個SM單元內部具有192個流處理器,密度非常大。「克卜勒」還在架構內部加入一些固定功能的模塊,以提升光柵化、紋理渲染性能,統一調配流處理器的任務分派。「克卜勒」還支持全新的GPU Boost 技術,能夠動態調節運行頻率,針對性能與功耗作出動態調整。
GK104晶片內部的一個SM單元結構示意圖
由此看來,「克卜勒」內部的CUDA核心,是以「小組」的形式組織管理的,單個CUDA核心獨立性低於「費米」架構,但卻在統一的協調下,理論峰值運算性能、特別是圖形運算性能有個巨大的進步。這可以說是對純通用運算架構GPU的一種反思。
克卜勒:對純通用運算架構GPU的一種反思
這種設計理念的轉變,讓「克卜勒」看起來也有點像「GCN」,在經歷漫長的設計理念分歧之後,GPU架構設計思路正在歸於一致:通用運算是未來,但更強大的圖形運算性能卻是現實。新架構下,GTX680顯卡遊戲性能達到了上一代GTX580的1.5倍,交出了一份出色的答卷。
克卜勒的另一面:NVIDIA轉向「小晶片」策略
從195W TDP功耗、35億電晶體、294平方毫米核心面積等規格來看,GK104對NVIDIA將會是一次巨大的戰略轉變:N卡將從此啟動「小晶片」策略,仿效AMD收購ATI之後的做法。GK104核心面積與2007年發布的G92差不多,比起GF110 520平方毫米的龐大規模,小了不是一點半點。
要理解什麼是「小核心」策略,就要先回到2006年AMD收購ATI之後。當時,A卡為了應對在性能大戰中長期的劣勢局面,而首先「發明」了「小晶片」策略,將HD3000系列顯卡從定位中端的HD3850/HD3870開始研發,力爭在中端主力市場上取得性能優勢,而後再利用小晶片「單卡雙芯」方案來爭奪高端市場。
GTX580顯卡的GF110是一顆「滾燙」的大核心
A卡這種「田忌賽馬」的「小晶片」策略,讓HD3850/HD3870獲得了很大的成功,而後A卡的「小晶片」策略在後續產品上一再上演,讓背著巨型架構規模、研發困難、高成本、高發熱量的N卡旗艦GTX280、GTX480、GTX580日益「電老虎」化,形勢逐漸被動。
AMD「小晶片」策略代表作:2007年的RV670圖形晶片
GK104效仿競爭對手的「小晶片策略」,對NVIDIA來說將是一次巨大的轉折,是N卡脫離被動局面、走上高能效之路的「一盤很大的棋」。從「克卜勒」195W TDP功耗、294平方毫米核心面積、1GHz以上核心頻率等方面的規格來看,NVIDIA這一招「小晶片」策略打的還是挺漂亮,日後的GK110、雙芯GK104等顯卡,都將是「克卜勒」攻佔巔峰性能的衍生。
「克卜勒」的另一層意義:NVIDIA開啟「小晶片」策略
從近年來GPU晶片設計理念的變化看來,「克卜勒」是一款有巨大進化意義的產品,「小晶片」策略更是讓N卡設計思路也歸於高性能、低功耗正途,是一款真正有設計突破的產品,更符合時下的消費潮流。日後,相信「克卜勒」新架構顯卡在價格成熟之後,也肯定更值得玩家選購。
後續附加測試:GTX680顯卡超頻實戰
由於「克卜勒」在架構上的巨大變化,加上「動態核心頻率」這一新特性的影響,截至我們3月22日晚上完稿時,業界尚未推出有效的「克卜勒」超頻軟體。今早我們得到消息,影馳「Mangic Pannel K」軟體已經可以支持GTX680顯卡超頻到1200MHz,於是我們立即展開了測試。
超頻100MHz,3DMark 11測試得分X3454
超頻200MHz,3DMark 11測試得分X3571
Mangic Pannel K軟體當前已經可以讓GTX680顯卡的核心運行頻率提升200MHz的,繼續提升的話其實是無效的,因為顯卡還要受到最大功耗的限制。看來要想全面解鎖「克卜勒」超頻限制,還有待於非公版產品。
超頻到1125MHz核心頻率,HD7970 3DMark11跑分仍不及GTX680
在我們的實測中,公版HD7970顯卡在不更換散熱器、不增加核心電壓的情況下,最高穩定頻率為1125/5700MHz,繼續提升頻率的話,在3DMark 11測試中會出現花屏情況。在這個最高頻率下,HD7970測試得分為X3148。
超頻測試成績對比:
超頻測試成績
我們的測試都是在不更換散熱器、不增加核心電壓的情況下進行的,HD7970的最高穩定頻率為1125/5700MHz,在這個頻率下3DMark11跑分X3148,仍然不及默認頻率下的GTX680。而GTX680顯卡在超頻100MHz後得分3454分,超頻200MHz後得分3571分,這樣的成績更是HD7970難以企及。
超頻200MHz後,GTX680顯卡性能再次提升了9%。而且在我們的實戰中,這款顯卡似乎還比較好超,1200MHz核心頻率下仍然運行的很穩定。由此看來,日後N卡各大合作廠商的非公版GTX680顯卡,性能/頻率都有望再創新高。而A卡方面,之前傳言中的「高頻版HD7970打敗克卜勒」已經變得很不現實(全文完)。[返回顯卡頻道首頁]