2012年是一個具有特殊意義的年份,我們非常幸運的至今都還沒有迎來山崩、地裂、海嘯或者世界毀滅什麼的,同時還收穫了AMD和NVIDIA為我們奉上的全新圖形架構及十餘款各具特色的顯卡產品。既然都到11月份了地球還看不出有什麼要完蛋的架勢,那大家是不是可以放下心來好好用新顯卡玩玩遊戲,然後靜靜的審視一下過去一年中所發生的一切了呢。
2012年也是一個奇特的年份,無論AMD還是NVIDIA都將精力集中在了新圖形架構以及新技術的開發上,不遺餘力的用一個又一個的新技術來強化自己的產品,這種數年未見的雙方同時努力精進的態勢給人滿滿的希望。整個業界都在注視著這一年的顯卡市場,渴望看到經由激烈技術對抗碰撞出來的燦爛火花以及期盼許久的市場復甦。但最終,大多數人都失望地發現,碰撞、火花以及復甦都沒有如約而至,整個2012年完全可以用一邊倒來定義……
屬於技術的2012是由AMD的Tahiti開啟的
無論結局是否出人意料或者難以理解,任何結果都有其出現的原因。很多人都無法理解為何同樣努力,同樣在技術層面不斷地推陳出新,AMD和NVIDIA在這一年裡卻收穫了不同的結局。有介於這一令人產生「這不科學」想法的現狀,從今天開始,我們將以三期連續文章的篇幅,對2012年度AMD和NVIDIA在技術、架構以及發展路線上的表現進行一次全方位的總結。我們會回顧2012年到來的各項全新GPU技術,並將這些技術的碎片重新拼接成一整完整的架構地圖,再通過這張地圖的指引找到我們要尋求的答案。
接下來,就讓我們一起進入回顧的第一部分,來看看2012年的顯卡界究竟有哪些值得我們記住的新技術出現吧。
》現在去顯卡道轉轉《 | 》看看今日最新文章《
》顯卡精彩美圖匯總《
● 運算就是圖形—Compute Unit
Tahiti構架中ALU集群部分的改進,是我們在2012年AN新架構中看到的第一項全新技術應用。與傳統AMD構架的VLIW結構ALU團簇不同,Tahiti構架的ALU集群撤消了來自超長字節指令的限定,所有ALU全部以SIMD的形式來完成吞吐,不再需要VLIW過程。
在Tahiti構架中,ALU團簇的名稱從VLIW SIMD變成了Compute Unit,名稱的改變不僅標誌著功能及用途的變遷,更暗示了內部結構的方向性變化。Tahiti擁有32個CU單元,CU內部包含4組SIMD CORE,每組SIMD CORE由16個標準Vector ALU構成,所以Tahiti的一個CU單元擁有64個Vector ALU,32個CU單元合計擁有2048個Vector ALU。
Tahiti構架CU結構細節
除了負責浮點吞吐的SIMD CORE之外,Tahiti構架的每個CU單元還擁有在一個Scalar Unit,Scalar單元中包含Int ALU單元,可以用來處理整數指令以及特殊函數。另外,對線程效率至關重要的原子操作(Atomic)也在該單元中執行。在結構上,CU單元已經同Fermi的SM以及Larrabee的Vector Core趨於接近了。
Intel Larrabee構架
運算單元之外,Tahiti構架的每個CU還綁定了由Branch和Scheduler構成的二級線程控制機制,以及一個完整的Texture Array,Texture Arroy的作用與傳統AMD構架中的TMU基本相同,包含了完整的Texture Fetch Load/Store Unit以及Texture Filter Unit。
CU進行wavefront吞吐示意
一個Vector Unit就是一個獨立的處理單元,能夠面對一個標準的指令集群或者說線程塊,也就是AMD的wavefront以及NVIDIA的warp。Tahiti的CU能夠在一個周期內處理一個64線程的wavefront,這與Fermi一個周期處理一個32線程的warp是相同的,但AMD目前上不存在類似half warp的線程塊子劃分機制。
Tahiti支持WinZip最新版帶來的Open CL加速
拋棄單純強調吞吐的基於VLIW機制的多ALU綁定結構,轉而以更加靈活的1D Vector ALU的舉動對AMD的意義是巨大的,更新之後的CU單元在計算能力和效率方面有了長足的進步,它令Compute Shader處理能力大幅提升,進而提升了GPU在DirectX 11環境下的圖形性能,而且在通用計算領域也獲得了更加廣闊的前景和更多樣化的發展可能。CU的出現,標誌著AMD在邏輯結構設計以及GPU架構發展方向上終於從R600開始的漫長「歧途」中回到了正軌。
● 收穫成熟——SMX
SM是NVIDIA GPU的ALU團簇基本單元,而這一單元在NVIDIA克卜勒時代的首款架構GK104中的改進可謂翻天覆地,NVIDIA採用的全新的SMX單元徹底改變了傳統的SM單元的內涵。
SMX單元與Fermi的SM單元在邏輯結構上十分近似,都擁有完整的幾何前端,線程仲裁機制,ALU團簇,Texture Array以及unified cache/shared和Register。除了沒有後端之外,可以說一個SM/SMX單元在結構上已經趨近等同於一顆標準GPU了。
GK104邏輯構架
與SM單元相比,SMX單元急劇放大了ALU團簇的整體規模,其ALU總量從過去的32個增加到了192個。與此同時,SMX單元的線程仲裁管理機制也得到了放大。負責線程分派和發放管理的Warp Scheduler從過去的兩個增加到了4個,與之對應的Dispatch Unit從過去的2個增加到了8個,Warp Scheduler與Dispatch Unit的比例提升到了1:2,這些舉措可以有效的改善單元規模增大帶來的線程分派及管理壓力。
SMX單元結構
在放大ALU團簇以及線程仲裁機制的同時,NVIDIA還進一步放大了與ALU團簇對應的Register。GK104中每個SMX的Register較之Fermi的SM放大了一倍,達到了65536X32bit的規模。
更為強勁的SMX性能
從SM到SMX的改進,主旨在於削減硬體管理機制與ALU的比例,開始嘗試將控制管理工作交由性能功耗比更高的組件來完成,它標誌著NVIDIA在長達8年的邏輯結構發展路線上進入了全新的階段。它對從G80到GF100的諸多努力進行了收穫和總結,並為NVIDIA後續的架構打開了大門。
我們在2012年中見到的最具顛覆性的新技術,來自NVIDIA在GK104中引入的GPU Boost動態頻率管理機制,它的出現徹底改變了人們對於性能、功耗以及顯卡使用方式的傳統定義。
GPU Boost技術的核心內容,在於通過遍布全卡的數十個傳感器實時收集數據,並根據這些數據掌握整卡的即時功耗狀況,然後根據當前功耗與設計TDP之前的差距,動態的調節GPU的運行頻率,使其能夠運行在更高的頻率之上,以達到隨時隨地自動獲取最大性能的目的。
GPU Boost可以充分利用實際功耗與TDP的差值空間
每一款不同的遊戲程序/應用因為各自不同的編程特點,在實際運行中會令構架反映出不同的負載或者說GPU使用情況,這種GPU負載的不同,歸根結底是GPU構架的單元復用率以及程序對硬體不同組元使用率差異造成的欠載所導致的。這些無法避免的欠載,會讓GPU在絕大多數場合都不會運行在設計功耗數值之上。欠載以及未能讓GPU運行在既定滿載功耗這一現象本身,實際上就是GPU內部單元復用率不足的外在表現。
當構架設計完成之後,構架的諸如單元復用率之類的特性也就隨之凝固,遊戲程序及應用程式在編寫完成之後也要面臨對不同構架使用情況發生凝固的情況。既然我們無法改變構架的單元復用率,也無法適時修改程序對單元的使用情況,同時兩者的矛盾已經已經被體現在了實際運行功耗與設計功耗之間的差異上,那麼增大整個構架的運行頻率,善加利用實際功耗與設計功耗之間的差值空間來獲得更高的總執行能力,就成了提升性能以及解決單元復用率不足矛盾的最好辦法了。
GPU Boost在應用程式中是實時調整的
GPU Boost技術所進行的動作,實際上是建立在性能與功耗平衡的基礎之上的。當前頻率下單元復用率不足會帶來實際功耗與設計功耗之間的差異,可以被等效成頻率的提升額度。所以GPU Boost可以以TDP為終點,根據遊戲中瞬時單元復用率決定的欠載情況決定GPU的實時運行頻率,讓GPU能夠在功耗一直維持在設計水平的前提下,實時的獲得最強的遊戲性能。
與此同時,GPU Boost對於頻率的控制還具有反向性。當玩家們覺得當前的遊戲幀數遠遠大於自己的需求時,也可以通過對幀數的限定來讓GPU Boost達到節能的目的。因為構架的單元復用率凝固且時時刻監控,較低的幀數需求也就意味著較低的頻率,因此GPU Boost可以根據玩家限定的低於最大構架性能的幀數來實時下調GPU的運行頻率,並達到節能以及換取更佳功耗表現的目的。
GPU Boost正常動作記錄
我們必須強調的一點——GPU Boost並不是單純意義上的超頻。傳統意義上的超頻是頻率動作的終點,一旦超頻完成,GPU頻率將不會再根據任何情況發生變動。而GPU Boost對頻率的調節是建立在實時真實功耗與TDP差值的基礎之上的,它既可以讓GPU充分利用功耗差值空間來運行在比超頻頻率更高的頻率之上,又可以通過限定幀數/性能需求來讓GPU運行在更低的頻率水平上。因此GPU Boost技術出現之後的超頻,變成了頻率控制的起點。
GPU Boost定幀節能動作記錄
利用功耗空間動態調節頻率來解決GPU內部單元復用率不足的矛盾,同時還可以反向的利用限定性能上限的方式來換取更好的功耗發熱表現,這些特性讓GPU Boost成了目前為止我們所見過的最具想像力,同時也是最直接的綜合性能/功耗管理手段。相信在未來的日子裡,我們將會見到更多類似的通過外部努力來解決GPU單元復用率不足矛盾的方案出現。
有介於其重要意義,我們針對GPU Boost的兩方面特性表現進行了深入的測試和探討,您可以在下面的連接中看到他們。
《遊戲功耗見真章 GPUBoost作用深入測試》
《遊戲功耗也能DIY? GPUBoost節能特性解析》
● 實用就是好技術——AMD Boost
與GPU Boost相比,AMD Boost出現的有些倉促,在功能性和意義上也略顯單薄,但它依舊起到了控制產品功耗的積極作用,這對於飽受D線壓迫之苦的Tahiti來說,無疑是一項非常重要的技術進步。
作為最主要的改進,AMD在HD 7970 GHz Edition中同樣引入了名為「Boost」的GPU頻率動態調節機制,但與NVIDIA的GPU Boost不同,AMD Boost的作用並不是提升顯卡性能,它的作用是通過降頻來保護GPU的運行安全,或者儘可能的保護由高頻帶來的性能提升。
AMD版本的Boost技術實際上是一個高負載保護機制
AMD Boost功能基於改進型的Power Tuner,AMD在HD 7970的BIOS中加入了新的一檔P-State(運行頻率段位通稱,並非官方命名),該檔P-State對應HD 7970 GHz Edition的默認運行頻率1050MHz以及默認運行電壓1.256V,在此基礎上還細分了1000MHz及以下頻率的P-State段位,加入了更為豐富和細膩的電壓設置。
AMD Boost動作期間GPU實時頻率及GPU佔有率狀況
在正常狀態下,運行大多數遊戲應用以及測試程序所產生的負載允許該卡維持這一檔P-State。當某些特定的遊戲以及測試程序,比如Furmark導致HD 7970 GHz Edition的運行功耗超過設計安全上限時,Boost功能會通過Power Tuner實時的將顯卡的默認運行頻率從最高的1050MHz直接拉回1000MHz,同時將電壓拉回至1.1V附近的範圍動態調節。
AMD Boost在Crysis2實際遊戲過程中的表現
GeForce GTX 680的默認運行頻率為1006MHz,大多數遊戲應用的負載都無法讓該頻率運行的GeForce GTX 680達到功耗的設計上限,因此GPU Boost功能會動態抬升GPU運行電壓以及頻率並提升性能,一旦GeForce GTX 680的運行功耗達到設計上限,GPU Boost將停止抬升動作。而AMD Boost則剛好相反,在遊戲或者應用讓HD 7970 GHz Edition的負載達到設計安全值之前,它並不會進行任何動作,一旦HD 7970 GHz Edition的運行功耗達到安全閾值,AMD Boost將會介入並完成強制降低GPU佔有率、降頻以及降壓等一系列動作,透過限制性能的方式來完成對顯卡的高負載保護。這樣的動作特徵,與GPU Boost在面對性能過剩並進行定幀節能時的做法是非常相似的。
GPU Boost在Crysis2實際遊戲過程中的表現
簡單來說,AMD Boost技術的目的和結果是在必要時通過降低性能來保證顯卡處於安全範圍內,它會在顯卡不安全時實時動作,而顯卡安全時它並不會介入運行過程,雖然略顯粗獷和原始,還無法像GPU Boost那樣在功耗和性能兩端自由充分且更加開放的遊走,但它確實可以起到控制峰值功耗並儘可能保護高頻性能的作用。
● 更深度的沉睡——Zero Core
對承受著D線壓迫的Tahiti來說,盡一切可能的降低能耗是非常重要的,在這種需求背景下,Zero Core誕生了。在新的Zero Core技術中,AMD引入了更加敏感的功耗調節點,能夠更加細密的實時監控顯卡的運行狀態,同時讓其更加積極地向更低功耗的頻率去轉移。
全新的「黑屏」待機模式
另外,AMD還引入了全新的「黑屏」模式,當電腦處於節能待機狀態且屏幕進入無輸出的節能狀態時,HD7970會關閉絕大部分卡上功能單元,通過這一類似關閉顯卡的動作,HD7970的最低待機功耗將小於3W。
待機功耗最低低至3W
在多卡互聯領域,Zero Core同樣提供了更加豐富的功耗管理機制。當用戶處於2D桌面待機狀態時,Zero Core允許主卡(輸出卡)以外的所有CrossFireX成員卡全部達到風扇停轉的深度休眠狀態。當3D負載到來時,功耗管理機制會及時喚醒深度休眠的顯卡,讓其能夠投入渲染工作中。
多樣化的多卡互聯功耗管理機制
Zero Core對於單卡常規桌面應用意義不大,但卻可以在許多常見但又相對特殊的場合發揮明顯的作用,比如說掛機下載以及長時間無輸出需求的待機。對於多卡互聯的用戶來說,Zero Core讓副卡在桌面環境下進入深度休眠的做法則可以起到更明顯的節能功效。
● 節能抗裂——Adaptive VSync
Adaptive VSync是NVIDIA在GTX680中引入的另一個重要新功能。它不僅改變了傳統垂直同步分段式的幀數管理模式,用更加平滑的幀數曲線來最大限度的避免畫面撕裂的情況發生,還帶來了比傳統垂直同步更優秀的功耗平順度和節能特性。
傳統的垂直同步依舊會帶來畫面撕裂和頓挫的問題
在傳統的垂直同步設定中,幀數一般會被機械的劃分成30以及60幀兩檔,當遊戲幀數大於60幀時,垂直同步程序會將幀數限定在60幀,而當遊戲實際幀數跌落到60幀以內時,垂直同步會將幀數限定成30幀。巨大的幀數落差不僅會給玩家們的遊戲過程帶來明顯的頓挫感,同時還會導致畫面撕裂等問題的出現,這不僅影響了遊戲過程本身,更與垂直同步技術本身消除畫面撕裂的初衷相悖。
GTX680的Adaptive VSync技術
在Adaptive VSync中,NVIDIA打破了傳統垂直同步技術對幀數下限的限制,當遊戲幀數低於60幀之後,Adaptive VSync將會儘量讓幀數維持在當前水平,而不是像過去那樣直接進入30幀檔位。而當遊戲幀數大於60幀時,傳統的垂直同步機制依舊會發揮作用,遊戲幀數依舊會如果去那樣被限定在60幀上。
Adaptive VSync選單
相比與傳統的垂直同步,Adaptive VSync技術能夠帶來更加平滑的幀數體驗,避免幀數突然暴跌帶來的最小幀問題。在此基礎上,Adaptive VSync並沒有幹擾幀數大於60時垂直同步機制的正常工作,因此從深層意義上來講,Adaptive VSync才是真正實現垂直同步初衷的幀數控制機制。
● 視頻領域的「異構架構」——VCE
顯卡的功用不光只有運算和圖形而已,對於視頻的處理同樣是顯示應用的一個重要的組成部分。所以在回顧各種提升運算/圖形效率以及降低能耗的顯卡技術之後,接下來我們要面對的將是在2012年出現的一系列與視頻處理相關的新技術。
VCE技術是AMD在Tahiti構架中引入的另一個重要改進,相較於UVD3.0的原地踏步,VCE技術的出現可以說是Tahiti構架在視頻相關方面最引人注目的亮點。
VCE功能細節
VCE技術從本質上來說是一組專門負責編碼操作的硬體電路,該單元在操作方式上類似Intel Quick Sync Video高速視頻編碼處理電路,都是通過固定單元來高速完成視頻編碼過程的Preprossing以及Encode過程,這也是整個視屏編碼過程中最為消耗系統運算能力的部分。以專門的電路來完成類似的操作不僅能夠提升處理速度,同時還可以大幅降低處理過程所帶來的功耗壓力。
VCE單元Full模式
VCE與Quick Sync Video最大的不同,同時也是VCE意義最重大的設計,來自它的異構式處理結構。VCE對視頻編碼的操作分為兩種模式,在Full Mode下,VCE會以自身的硬體單元來完成Preprossing以及Encode的全部過程。而Hybird Mode下,VCE單元會調用Tahiti構架豐富的ALU資源來更高速的完成Preprossing過程,以VCE自身的硬體單元來完成Encode過程。在性能最理想的狀態下,VCE可以實現1080P解析度視頻的60幀速率實時編碼。
VCE單元Hybird模式
VCE技術的意義是巨大的,除了在GPU單元中第一次引入了低功耗的專用高速視頻編碼處理電路之外,VCE上還體現了AMD多年來一直強調的異構計算操作結構的思想。Fusion的精髓便是異構處理和並行加速,這種整體思路正在逐步融入AMD的每一個產品線甚至每一個適合的產品中。
● 殊途同歸——NVENC
AMD引入了針對視頻的硬體編碼處理單元VCE,而Intel早在Sandy Bridge中就已經引入了類似的電路。為了避免自己被甩在後頭,Kepler中同樣加入了類似的針對性解決機制——NVENC。
NVENC特性
能夠提供了一組專門的邏輯電路設計,它可以大大加快包括H.264在內的多種高清視頻格式的編碼和轉碼速度。按照NVIDIA提供的數據,NVENC可以4~8倍於「real-time」的編碼速度,如果以24幀的播放速率作為real-time的標準,則NVENC可以實現遠大於60幀的高清視頻實時編碼過程。
MediaEspresso軟體界面
除了提供更快的編碼及轉碼速度之外,NVENC還提供了更好的性能瓦特比。它可以以十分之一的功耗實現與軟體編碼過程相同的性能,這從側面進一步契合和呼應了Kepler構架著重強調性能瓦特比的特點。
● 自由的寬域——Eyefinity 2.0
民用低成本多屏拼接的Eyefinity技術一直是AMD的長處。在2012年中,AMD將Eyefinity技術升級到了2.0版本,新的Eyefinity寬域技術為我們帶來了更多富有特色的輸出方案和視覺體驗。
Eyefinity技術不斷沿革
在Eyefinity 2.0技術中,AMD首次將多屏輸出技術和HD3D立體技術結合在了一起,HD7970的用戶僅需使用一塊顯卡便可以在多屏系統上同時體驗立體遊戲和電影。NVIDIA在SLI系統中雖然早就實現了3D Vision,但始終需要至少兩塊顯卡才能完成輸出工作。
Eyefinity 2.0的全新改進
新的Eyefinity 2.0率先採用了DisplayPort 1.2認證接口和HDMI 1.4a規範,在傳輸帶寬和速度上能夠通過更高的速度,為多屏3D應用提供更好的條件。AMD提供的HD3D技術是開放的,這讓更多的廠商能夠參與到AMD的HD3D立體顯示技術當中,AMD單卡通過DisplayPort 3D顯示器可以單卡實現三屏Stereo 3D效果。
AMD多屏允許不同尺寸顯示器
Eyefinity2.0最重大的更新來自解析度的多樣化及組建屏幕要求的降低,Eyefinity1.0至少需要3臺解析度一致的顯示器才能組建多屏輸出,這要求很多用戶採購新顯示器,組建成本並不低。而在Eyefinity2.0中,AMD允許不同尺寸顯示器組成一套Eyefinity多屏顯示系統,這進一步降低了多屏輸出的成本。但受限於現在的遊戲輸出技術,Eyefinity2.0在多個不同尺寸顯示器組合的方案中還存在部分場景及物體顯示不全等問題,相信隨著技術的不斷進步,這些問題終將得到解決。
全新的獨立多路音頻輸出
音頻輸出能力的改進也是Eyefinity2.0的革新之一,Eyefinity2.0支持獨立數字多點音頻(Discrete Digital Multi-Point Audio),簡稱DDM Audio。Eyefinity1.0隻能輸出一路音頻信號,而新版本則可以實現獨立多路音頻輸出了,這樣多屏看電影或者玩遊戲時,每個屏幕都可以進行獨立的音畫輸出。
● 大家終於一樣了——3D Vision Surround
長期以來,NVIDIA對單卡多屏的支持一直都不是十分的積極。儘管這其中有傳統構架的單芯顯卡的確不具備多屏大解析度流暢渲染的能力,即便具備多屏輸出能力也無法用來順暢地運行遊戲,但其保守的做法並未得到所有用戶的理解。
在Kepler架構中,NVIDIA終於兌現了自己的承諾——當單芯顯卡在3840*1200甚至更高解析度環境下具備流暢運行遊戲的能力時,NVIDIA將會為玩家們提供對應的單卡三屏甚至以上級別的多屏輸出支持和立體視覺解決方案。於是,Single Card 3D Vision Surround來了。
Single Card 3D Vision Surround可以實現單卡四屏輸出
在GTX680中,NVIDIA提供了完整的DVI、HDMI1.4a以及DP1.2接口,提供了單卡3840X2160X60Hz的4K解析度級顯示器的支持,允許單塊顯卡同時輸出4個顯示器,其中包含3個3D Vision輸出以及一個輔助顯示輸出。
Single Card 3D Vision Surround可以實現單卡三屏3D輸出
單卡三屏以及單卡三屏3D輸出的實現,讓N卡玩家們終於獲得了期盼已久的較低成本多屏輸出解決方案。目前的Kepler架構不僅可以提供比過去更加全面的多屏輸出選擇,更可以以比過去低非常多的功耗來完成多屏輸出和3D Vision多屏輸出。
很顯然,2012年是屬於「提升性能+降低功耗」的年份。無論是CU/SMX,GPU Boost/AMD Boost還是VCE/NVENC,甚至是單卡多屏相關的Eyefinity2.0/single card 3D Vision Surround,它們的作用和直接結果之一,都是以更低的能耗來實現更好的性能或者更多的效果。
無論怎樣革新,任何技術都必須具備明確的正確性以及充分的可用性才算具有實際意義。有介於此,我們並沒有將TXAA,DX11.1,Bindless Tex以及PRT等或存在爭議或在可見未來內無太大實際意義的技術納入到年度技術回顧當中。
Kepler架構的Bindless Texture
對於AMD和NVIDIA來說,2012年對它們來說都是革新和相互借鑑滲透的一年。通過CU等一系列革新,AMD進行了架構發展層面的各項「糾偏」動作,同時通過VCE等技術進一步強化了自己在視頻處理領域以及多屏輸出領域的優勢。而NVIDIA則通過Kepler對自己的整條架構發展路線進行了很好地總結和延伸,同時在視頻處理以及多屏輸出環節進行了補充和追趕。NVIDIA在邏輯效率層面表現卓越,AMD就改進了ALU團簇的結構以提升效率,NVIDIA擁有GPU Boost,AMD就推出AMD Boost;AMD在單卡多屏層面具有優勢,NVIDIA就推出Single Card 3D Vision Surround,AMD有VCE,NVIDIA就拿出了NVENC。這種針對自己優勢的強調以及對劣勢的補充,讓雙方在這一年裡呈現出了明顯的「你中有我,我中有你」的態勢。
未能被新技術拯救的HD7970 GHz Edition
從單一技術或者特定應用層面來講,雙方在2012年的各個技術革新都是具有積極意義且行之有效的。我們今天回顧的這些技術都能非常實際的為用戶們帶來好處,同時可以明確的貫穿在用戶對顯卡的整個使用環節中。但就整體產品表現而言,AMD與NVIDIA在2012年度的表現卻並不都是向好的。
GPU架構其實就是各種技術的結合體
一款顯卡架構,本質上就是各項先進技術的綜合和應用,那為什麼「具有積極意義且行之有效」的各項技術,被揉捏在一起形成GCN以及Kepler這兩個系列架構之後卻具備了完全不同的兩種表現呢?GCN以及Kepler這兩個出現在2012年的全新顯示架構體系,又分別具有怎樣的特性呢?在下周的《顯示世界的2012中篇》中,我們將會為大家進一步解讀GCN體系的Tahiti/Pitcairn/Cape Veder架構以及Kepler體系的GK10X架構的特點回顧,並進一步為您帶來上書這些問題的答案,敬請期待吧。
AMD和NVIDIA,在2012年都做了什麼?尤其是在產品技術上為我們帶來了什麼?本文作者秉承一貫的嚴謹技術風,為大家盤點屬於圖形世界技術的那點事……