遊戲顯卡的江湖上流傳著這樣的傳說,凡是N卡豪門旗下披著6號戰袍的產品都會擁有著異常火爆的市場表現。這一規律被稱為「逢6必火」定律。自從NVIDIA推出6600GT以來,幾乎每一代帶「6」的顯卡都大火特火了起來。但上一代GTX 960由於一些問題最終沒有大火特火起來讓N粉們有些失望,而最近發布的新一代帕斯卡中端顯卡 GTX 1060是否能撿起舊日的榮光,重新續寫「逢6必火」的傳奇呢?
2016年5月,NVIDIA發布了最新一代的帕斯卡架構產品,並且使用了16nm FinFET工藝製造。同時發布的GTX 1080和GTX 1070都表現出了巨大的性能提升,而作為傳統意義上的主流產品,GTX 1060直到兩個月後的7月初才低調發布。
在NVIDIA發布GTX 1060之前老對手AMD已經祭出了自己的主流顯卡RX 480,讓這一價位的爭奪成為了再一次的N/A大戰的首次交火。作為這一代的NVIDIA中端主力型號,GTX 1060又有怎樣的戰鬥力呢?
Pascal GP106核心解析
NVIDIA在經歷了四年基於28nm FinFET製造工藝製造GPU的漫長歷史以後,基於Pascal GP104的GeForce GTX 1080首次迎來了16nm FinFET製造工藝升級。更高精度的「光刻」工藝允許GPU在單位面積的晶片上集成更多數量的電晶體,在同樣的核心架構中,更加龐大的核心規模就意味著更強大的處理性能。所以16nm FinFET製造工藝能夠給NVIDIA新顯卡帶來的能效提升是可以預見的,但是一直在超越自己的NVIDIA並沒有被動享受製程進步的紅利,反而在新一代的顯卡中使用了更為先進的技術。這其中就包括GTX 1060使用的GP106核心。
GP106核心邏輯架構圖
GTX 1060的GP106核心內建2組GPC和6個顯存控制器,每個GPC包含5個SM,1個SM中集成了128個CUDA單元、8個紋理單元、256KB的二級緩存、96KB的共享儲存空間以及48KB的一級緩存。從規格上來看,GP106更像是GTX 1080所使用的GP104核心在除顯存控制器之外其它多數規格砍掉一半而成的。
SM流式多處理器能夠高度協調其中的CUDA核心以及其他功能元件的工作,這20個SM會參與到幾乎所有GPU執行的所有命令中。GeForce GTX 1080擁有8個位寬為32bit的顯存控制器,每一個顯存控制器配有八個ROP單元和256 KB二級緩存。所以,完整GTX 1080的GP104核心共有2560個CUDA單元、256bit顯存位寬、64個ROP、160個TMU以及2MB二級緩存。
GP106的核心電晶體數量為44億,核心面積為200 mm2 ,略小於麥克斯韋家族GM206的227mm2,得益於16nm FinFET工藝的應用,每平方毫米的電晶體數量達到了22.9m,遠遠高於GM200。這也是GP106以及其它Pascal架構顯卡能耗比如此高效的主要原因之一。此外,CUDA數量1280個,ROPs數量48個,TMUs數量80個。
NVIDIA將GPU開發工作的重點放在了設計Pascal核心架構的每一個細節中。Pascal之所有能夠成為有史以來能效最高的GPU,原因不僅僅是16nm FinFET帶來的製造工藝精進,更得益於持續提高的核心效率。NVIDIA工程團隊的一大精力投入重點是GPU核心運行頻率,橡木桶定律那樣,GPU核心運行頻率是由數以百萬計的設計電路中速度最慢的那一路徑決定的,所以這一最慢路徑的優化對於GPU核心運行頻率的提高是至關重要的。經過NVIDIA工程團隊在這一領域的不斷鑽研,Pascal架構GPU相比前代有著40% 的運行效率提升。單靠16nm FinFET的製造工藝,是不能夠帶來如此高比例的核心頻率提升的。
SMP技術和Ansel工具介紹
Imultaneous Multi-Projection多畫面同步投射技術
多畫面同步投射技術(SMP),可以讓基於Pascal架構核心的GPU以16個角度渲染畫面並分別呈現。為了實現多畫面同步投射技術,NVIDIA在Pascal架構核心的GPU中集成了新的多畫面同步投射引擎模塊。
SMP單元負責在渲染一個畫面之前,生成多個視角再分別交給CUDA及其他元件進行渲染。SMP可用於許多新的圖形技術,列如環繞透視、鏡頭陰影的匹配、單通道虛擬實境VR,多解析度渲染。
這些新的圖形技術對於虛擬實境VR有著頗多的益處,能夠帶來多達1.5倍的像素輸出量和2倍以上的幾何圖形輸出量。
環繞透視
環繞透視可利用SMP在三個顯示器中呈現出的更寬視野和具有正確透視關係的圖像。
單通道虛擬實境VR
NVIDIA VRWorks可以利用SMP技術以減少在渲染虛擬實境VR畫面時的幾何運算量。GeForce GTX GPU1080憑藉單通道虛擬實境VR圖形技術,可通過一次運算就能將一個畫面以雙眼的視角呈現出來,這就相當於減少了GPU幾何圖形一半的運算量。
鏡頭陰影的匹配
鏡頭陰影的匹配通過計算,讓VR頭戴顯示設備直接顯示根據設備矯正過的畫面。避免了渲染之前過多不需要的圖形被浪費掉,以大幅提高VR圖形渲染性能。
多解析度渲染
在遊戲時,玩家們往往是將最多的注意力集中在畫面的中心,所以通過多解析度渲染技術,GPU可以將更多的資源分配去渲染遊戲中心位置的畫面,以此來提高玩家在遊戲時的視覺體驗。
在遊戲產業高度發展的今天,玩家們對遊戲的訴求已經不是簡簡單單的娛樂放鬆,他們要求遊戲可以以藝術甚至自我表達的層次呈現在人們面前。為順應這一要求,NVIDIA開發出了極具開創性的Ansel截圖功能,可以讓玩家以自己特有的方式,去發現遊戲中的美。
玩家們在遊戲中碰到精彩的瞬間多會截圖保存,其中有些遊戲提供的截圖功能異常簡單,就是截取一堆當前的遊戲畫面,退出遊戲後再慢慢挑選自己理想的。開創性的Ansel則可以讓玩家在遊戲中使用Ansel截圖功能後定格遊戲世界,然後玩家可以以任何自己想要的方位和角度進行精彩瞬間的抓取。
你還可以為截圖添加不同的Photoshop濾鏡效果,並調整景深、色調、光照、紋理等畫質細節.截圖的解析度也不是鎖死在遊戲解析度上,而是可以大幅度提高,甚至能達到9600×5400這樣的變態級別,相當於4K顯示器的六倍以上!它甚至還可以截取VR全景照片,並能發送到手機APP上,然後藉助一些手機VR設備就能欣賞的VR遊戲場景。
360度全景遊戲截圖
超高解析力遊戲截圖
Ansel工作原理
Ansel首先基於NVIDIA GPU,然後以資料庫的方式無縫銜接到驅動程序和遊戲之間。NVIDIA為Ansel設計了標準化的UI控制項,將其作為開放的SDK供遊戲開發人員使用,使遊戲開發人員可以輕鬆地將Ansel集成到遊戲程序當中去,這樣遊戲玩家不論在什麼遊戲當中都可以使用到界面標準統一的Ansel工具了。
Ansel中的三個界面:
1.setConfiguration - 遊戲設置,例如被用於遊戲中的坐標系統。
2.isSessionActive - 顯示Ansel是否在控制遊戲。
3.updateCamera - 遵從遊戲中的使用限制
顯卡外觀解析&拆解
我們這次拿到的是Founders Edition版本 與以往不同,NVIDIA在這一代的公版6系列顯卡上使用了與高端產品類似的「泰坦皮」散熱器。可見NVIDIA對這款產品的自信和重視。
GTX 1060背面沒有配備金屬背板,整體長度在25cm左右PCB長度僅有17釐米,要比散熱器短上不少,這樣的設計在RX480上也同樣存在。給後續推出超短尺寸的GTX 1060提供了可能。另外GTX 1060並沒有配備SLI接口,雙6秒旗艦的情況在這代並不會出現。
還是熟悉的配方,還是熟悉的味道,沿用多年的渦輪散熱器的好處是可以將熱量排出機箱之外,降低機箱內部溫度。但由於結構限制,散熱效能一直比較一般,另外風扇轉速較高也會有一定的噪音問題。
接口方面一共擁有三個DP1.4接口和一個HDMI2.0b接口,以及一個DVI-D接口 。
打開散熱器可以看到散熱器與PCB之間有一條飛線連接,這其實是布置在顯卡前端的6Pin電源接口的延長線,如此布置據說是為了顯卡的整體美觀。對此筆者持保留意見。
PCB長度為17cm,GPU周圍布置了6枚單顆容量為1GB的GDDR5顯存,GPU晶片左方是3+1相數字供電模塊。120W的TDP顯然並不需要過高的供電規格。
PCB背部特寫
顯示核心型號為GP106-400-A1,採用臺積電16nm FinFET工藝製造,基於最新的Pascal架構。默認核心頻率為1506MHz,Boost頻率為1709MHz。
所使用的顯存不出意料的來自三星,單顆容量1GB,等效頻率高達8000MHz。
公版GTX 1060與GTX 1080外觀對比
公版GTX 1060長度上只有25公分,要比常規ATX主板寬度要窄上一些。厚度上佔用兩個PCI槽位,沒有多餘突出。
為了避免其它因素對測試結果造成影響,我們搭建了一套i7-5960X+X99組成的硬體平臺,內存使用頻率高達3000MHz的DDR4 8GBx4內存套裝。驅動程序版本為GeForce 368.64和催化劑16.7.2。
GTX 1080 Founders Edition GPU-Z截圖
測試中使用的GTX 1060顯卡為Founders Edition版本,即過去我們所說的公版卡,默認核心頻率為1506MHz,Boost頻率為1709MHz。按照以往經驗,第三方廠商推出的非公版GTX 1060多數在規格上會有一些提高,主要體現在核心頻率和散熱性能上,所以性能會略高於Founders Edition版本。經過我們的測試,非公版的GTX 1080和GTX 1070相比公版會有著至少10% 的性能提升。GTX 1060的情況應該也會比較相近。
3DMark是著名圖形測試軟體廠商Futuremark推出的圖形性能測試程序,本次測試使用最新版本進行跑分。測試項目選擇常規的Fire Strike Extreme和Fire Strike Ultra兩個DX11測試項目以及近期推出的專門用於測試DX12性能的Time Spy模式。
3Dmark DX11基準性能測試中我們可以看到配備全新16nm帕斯卡核心的GTX 1060得分基本打平了上代次旗艦GTX 980。相比對手RX 480在兩種模式下分別取得了9.5%和8.4%的領先優勢。性能相當強悍。
在DX12測試Time Spy中,GTX 1060也表現不錯,相比與GTX 980得分十分接近,領先RX 480約2% 左右,基本處於同一水平。以往同價產品DX12性能處於劣勢的情況沒有再度出現。
接下來是VR性能簡易測試,使用常用的SteamVR Performance進行測試。
GTX 1060在SteamVR Performance測試中取得了8.1分的平均保真度成績。得分在GTX 980與GTX 970之間。結合我們之前測試RX 480時遇到的情況,雖然顯卡廠商已經就VR性能進行了相關優化,但SteamVR這類更新較慢的簡易跑分軟體所使用的引擎並不支持新的VR特性,造成了在跑分中新一代顯卡表現不正常。所以這項測試的參考意義一般,要想完美展現新舊顯卡的VR實際性能差距,出了等待Steam進行版本更新之外,只能等待權威測試程序VRMark早日上架。
遊戲性能測試
遊戲性能測試
遊戲測試環節,我們選擇1920x1080和2560x1440兩種解析度進行測試。特效水平開啟最高。分別選擇三款DX12和三款DX11遊戲進行測試。
DX12遊戲測試
DX11遊戲測試
從以上遊戲測試成績可以看出,GTX 1060表現十分不錯,與前代定位高兩個檔次的GTX 980處於同一基本打平,相比RX 480也表現出了可觀的性能優勢。即使在A卡擅長的DX12遊戲中也沒有顯出任何劣勢。
功耗散熱測試&評測總結
得益於16nmFinFET工藝和全新架構,GTX 1060僅僅120W的TDP顯然不能對如今越發大肚能容的電源構成威脅,頂級平臺加持下的滿載僅僅305W。散熱測試中在滿載狀態下溫度達到了82攝氏度,待機溫度僅34攝氏度,表現正常。公版散熱器的效能不高但也足夠堪用,想要獲得很好的散熱表現可以期待一向以堆料而著稱的一眾顯卡廠商的非公版產品。
N卡「逢6必火」的定律延續多年之後,玩家們不免對NVIDIA今年的GTX 1060充滿了期待,NVIDIA很明顯也沒有辜負玩家們。
在性能測試中GTX 1060表現出了戰平上一代次旗艦GTX 980的性能水平,實際遊戲測試更是印證了NVIDIA在這一代顯卡中使用的16nm Pascal架構的優越性。DX11模式下相對於對手的同等級產品RX 480有著10%左右的性能優勢,即使是在A卡傳統的優勢領域DX12測試中不落下風。另外得益於底層的大跨步前進更是帶來了更高的每瓦性能表現,超頻潛力值得期待。
NVIDIA官方給出的6GB版本建議零售價為1999元,部分非公版產品已經開啟了預售。(本次評測使用的Founder Edition版本並沒有出現在首批上市的產品中)結合其優良的性能表現,這樣的價格顯然具有著相當明顯的性價比優勢,市場表現十分光明。」逢6必火「的傳奇非常有希望在這一代得到傳承。 ■