前言:NVIDIA發布全新的GF110晶片無疑是最近顯卡市場上的一大亮點,雖然架構延續了Fermi的經典特性,但是它採用了全新的EDA設計讓功耗和發熱大降,無論是製造商還是用戶都對Geforce GTX580給予充分肯定。那GF110相對與GF100的提升在何處?GTX580相對與GTX480有哪些本質區別?
我們知道微軟選擇在今年底發布了Windows 7 SP1升級包,這次升級除了對安全性和兼容性提升之外,對硬體運行效率有多大提升?這篇文章將結合這兩個重點為大家展示升級版GPU和升級版作業系統之間的性能關係。
Windows 7將升級 SP1蓄勢待發俗話說「好馬配好鞍」,隨著第二代DirectX 11顯卡的嶄露頭角,作為軟體平臺的Windows 7也將迎來第一次大升級。隨著無限接近正式版的SP1補丁公測版官方提供,讓我們能夠有機會正式嘗鮮這次Windows 7設計帶來的改變。
尤其是在用戶關心的3D性能和GPU功能方面,Windows 7 SP1會給我們帶來何等體驗呢?在昨天發布的《A/N遊戲實測 Win7最新SP1是否值得升級》一文中,我們揭秘了Windows 7 SP1在3D性能方面的表現,本文將以GPU的通用計算功能和一些底層計算性能為基礎展開測試。
同時我們還會引入試下最惹眼的頂級顯卡GeForce GTX 580,雖然在《比GTX480快20% 卡皇完全體GTX580首測》一文中對其有了多方面的了解,本文將藉助Windows 7 SP1這個點從另外一面給大家展示GeForce GTX 580。
GF110晶片內部改進推斷在經歷了2010年3月27日首個Fermi架構GF100晶片發布之後,顯卡領域無論是製造商還是普通用戶,都看到了NVIDIA在面向未來應用方面的改進。但是這種徹底地改進引來了很多非議,首當其衝是其巨大的發熱和功耗問題,這種可製造性問題如果得不到很好解決,用戶獲得再強大的性能也無法擺脫髮熱和功耗的折磨,產品成本也會不斷提升。
正是在這種背景之下,一塊嶄新的GF110晶片誕生了。它僅是補全了GF100晶片屏蔽的流處理器和功能單元嗎?雖然大多數人是這樣認為的,但是事實證明大多數人都錯了。雖然這顆晶片的架構完全和GF100晶片相同,但是卻經過了徹底推倒重來的EDA設計。
我們通常習慣把30億電晶體的GF100晶片所產生的發熱原因,歸結與TSMC 40nm工藝不夠成熟所致,當然NVIDIA設計這樣大的一顆晶片也可以認為是戰略錯誤。實際上GPU晶片的EDA設計方案都是NVIDIA自己完成的,所以NVIDIA倉促的EDA設計才是導致GF100晶片發熱巨大的根源。
EDA技術是以計算機為工具,設計者在EDA軟體平臺上,用硬體描述語言HDL完成設計文件,然後由計算機自動地完成邏輯編譯、化簡、分割、綜合、優化、布局、布線和仿真,直至對於特定目標晶片的適配編譯、邏輯映射和編程下載等工作。
NVIDIA在2008年開始了Fermi架構的仿真設計,傳言在2009年初誕生了一塊512SP,512bit,128TMU的大號晶片,這是最初的GF100,但是很可惜由於電晶體開銷巨大和發熱功耗不可控,這顆晶片後來流產了。
此後經過精簡的GF100晶片誕生了,但它還是一個30億電晶體的大傢伙。在2009年末基於GF100晶片的Tesla首先登場,這批晶片額定頻率較低,開啟448個流處理器,所以功耗和發熱問題並沒有完全暴露。直到今年初發布GF100晶片,各種各樣的麻煩問題才被人們所重視。
電晶體集成度較高的晶片,或者說互聯層數多的晶片,設計要考慮磁通量和寄生電感等等不和諧因素,有資料表明G80開始NVIDIA就考慮通過絡磁點來降低磁通量,寄生電感。
以最為重要的絡磁點舉例,絡磁點是N個強度差不多的磁通線同時穿越的地方,如果絡磁點考慮不好,造成多條磁通線同時穿越同一位置,磁通量會變得特別強烈,會造成晶片發熱不可控。磁通量和熱量一般是正相關的,磁力會驅動離散電子做定向移動從而產生電流,進而轉化為熱量,不過這裡用電子還不如用載流子更為貼切。
在NVIDIA的GPU方面,大家熟知的EDA改進設計有兩個經典案例,首先是Geforce 8800GTX之後推出的Geforce 8800Ultra經過了非常完美的EDA設計,在頻率提升的前提下功耗下降。第二個案例就是GF104晶片,性能功耗比大幅度超越GF100晶片,Geforce GTX460因此而得到市場的一致肯定。
這次推出的GF110晶片,正是NVIDIA痛定思痛下決心改進的一顆大晶片,由於選用了業內頂尖的設計團隊,基於GF110晶片的Geforce GTX580在開啟全部512個流處理器和16個Tessellator之後依然保持了低於Geforce GTX480的功耗和發熱,這就是NVIDIA提出的全新EDA設計方案帶來的效果。
GTX580均熱板技術詳解在GTX480剛剛上市不久,AMD以HD6800系列一記重拳打向顯卡市場,本以為會大賺人氣、狂瀾橫財,但是沒想到天算不如人算,AMD又被NV擺了一道。GTX580的亮相,又將人們把視線從新拉回高端性能PK的混戰上。GTX580憑藉高性能、低功耗、超強超頻能力,以及強悍的散熱性能,讓號稱「卡皇」的5970也望塵莫及。
而在近日,NV公司公布了GTX580散熱技術細節。官方表示,GTX580之所以擁有強悍的散熱性能,主要是因為顯卡採用了「vapor-chamber 」均熱板的散熱解決方案。
均熱板,英文名叫做「Vapor Chamber」,其在散熱方式上與Heat Pipe(熱管)相比熱量傳導更有效,Heat Pipe為線性傳導而Vapor Chamber為2維平面傳導,導熱、散熱效率更高。由於Vapor Chamber熱阻值很低,僅為純銅材質的的1/2,也就是說Vapor Chamber的熱導效率為純銅的兩倍,散熱效率高。
Vapor Chamber的物理結構共分為5個技術層和8個物理層,由上至下分別為上表面、冷凝層、汽化層、導熱層和下表面,其中冷凝層、汽化層和導熱層分別為2層。
這是Vapor Chamber的工作原理圖,從吸熱底吸收熱量一直到冷凝液散熱冷凝。
這是Vapor Chamber內部結構在35倍、100倍和200倍顯微鏡下的實物結構圖。
這是Vapor Chamber散熱塊(下)和普通散熱塊,在散熱狀態下的熱量分布圖。很明顯普通散熱塊在熱源處溫度極高,熱量扇形球狀分布、熱量分布不均;反觀Vapor Chamber散熱器,整個散熱器不僅沒有溫度過高趨於,而且熱量分布均勻散熱效能強勁。
這是對比普通散熱器(左)、Heat Pipe散熱器(中)和Vapor Chamber散熱器(右)在相同熱源下的熱量傳導情況,很明顯導熱、散熱效率一次提升,Vapor Chamber效果最佳。
全新功耗控制與保護機制在本次發布的Geforce GTX580顯卡中,NVIDIA終於按耐不住使用了硬體晶片來控制整卡功耗,同時保護供電電路和GPU晶片不被燒毀,這種方式AMD在HD5000系列中也已經開始使用。
從Radeon HD5000系列開始,AMD不認為Furmark,OTTC代表了真實的遊戲功耗環境。通過首先在Cypress家族內置監控晶片,VRM過載(overcurrent)的時候,晶片會自動降頻到上一個powerplay 水平,直到過載減弱(或者VRM溫度恢復正常)。考慮到HD4000系列的極端功耗和TPD差距極大,而且HD5000系列採用clock gating和GDDR5完整節能特性僅對待機功耗幫助巨大。
NVIDIA在Geforce GTX580更進一步,內置的監控晶片實時收集PCIe接口和電源用量,反饋給驅動,讓驅動決定是否降頻運行以控制GPU功耗。
似乎Furmark、OCCT這一類極端的拷機程序都不太受AMD和NVIDIA的歡迎,NVIDIA甚至用"pathological」(病態)這樣的詞來形容Furmark,這些程序確實是把顯卡折磨得夠嗆,它們能讓顯卡超負荷運轉,根據多次測試,大致了解到運行Furmark能讓顯卡功耗超出規範值的20-50%。
GeForce GTX 580的Power Limiter功能對顯卡長期滿載時進行頻率調整,以便將整卡控制在一個較為合理的功耗範圍內,而Furmark不幸「中招」,所以GeForce GTX 580功耗測試,筆者挑選了一個相對功耗負載較大的遊戲進行測試。
在功耗測試中,GeForce GTX 580的單卡整機待機和滿載功耗分別是140瓦和359瓦,相比原GF100核心產品及Radeon HD 5870而言,這個功耗表現非常出色,從原來GF100的功耗大戶變成了現在的節電先鋒。
超能網在破解了GeForce GTX 580的Power Limiter功能後,使用Furmark軟體對這款顯卡的原始功耗進行測試得到上圖結果。這項測試證明了GeForce GTX 580和上代GeForce GTX 480相比,GTX 580擁有更多的流處理器數和更高的工作頻率,但是它的「真實功耗」和「真實溫度」都比GTX 480要略低(5W/5℃),可以說GTX 580在硬體上的優化是很明顯的,電晶體的漏電更小。
超頻至900MHz的Geforce GTX580通過測試
GF110核心的超頻能力著實讓筆者為之驚嘆,使用NVIDIA Inspector軟體經過簡單的調校,產品頻率輕鬆超至900MHz/1800MHz/4400MHz,此時性能得到大幅提升。在3Dmark Vantage Performance測試中,超頻後GeForce GTX 580輕鬆破3萬分。
規格補全Fermi架構所有遺憾在確認了GF110核心在半導體工藝方面的穩定特性之後,NVIDIA打開了當初Fermi架構全部的512個流處理器,並且將晶片額定頻率提升到772MHz,顯存頻率達到4000MHz,這時的GeForce GTX 580已經能夠大幅度領先於GeForce GTX 480,Fermi架構在這代產品上終於沒有遺憾,全部設計目標得以達成。
Fermi經典特性之圖形與計算並重
「CUDA Cores」是Fermi最基礎的運算單元,將它的歷史向上追溯首先是G80時代的統一著色單元(Unified Shader Model),我們在G80和GT200時代將它統稱為流處理器(Stream Processor),再向上追溯可知,這個單元將Vertex Shader(頂點著色器)和Pixel Shader(像素著色器)合併而成。
理論上說「CUDA Cores」只是起了一個好聽的名字,讓人們更看重GPU通用計算的作用,實際上我們在圖形領域還是將它視為普通的流處理器。但這背後透露出NVIDIA公司的另一種計劃面向並行計算領域設計一顆晶片,並使其具備圖形運算能力,這顆晶片由眾多的「CUDA Cores」組成,運算速度主要由「CUDA Cores」的數量和頻率決定。
Fermi經典特性之GPC區劃設計
GF110圖形架構核心,從硬體的塊數稱為圖形處理團簇(GPC)。每個GPC包含一個光柵引擎和四個SM單元。GPC是GF110佔主導地位的高層次的硬體模塊。除了計算單元它還包括兩個重要特點分別是一個可升級的光柵引擎(Raster Engine)、Z-cull和一個帶有屬性提取和細分曲面的多邊形引擎(Polymorph Engine)。
正如其名稱所示,所有的GPC都集成了關鍵的圖形處理單元。它包括頂點,幾何,光柵,紋理均衡設置和像素處理資源。隨著ROP單元功能的不斷增強,一個GPC單元可以被看作是一個配置齊全的GPU,而GF110擁有4個這樣的核心。
Fermi經典特性之自適應可讀寫緩存
通過了解不同的成千上萬的應用程式,NVIDIA工程師發現shared memory可以解決一部分程序的需求,但是不能解決所有的問題。一些應用程式天然需要shared memory,有些應用程式則需要緩存cache,有的既需要shared memory也需要cache。優化的內存設計可以既提供shared memory也提供cache,可以讓程式設計師根據自己的需求來做選擇。Fermi架構通過變化存儲器的資源配置,可以同時支持這兩種需求。
GF110的每一個SM中擁有64KB的可配置片上緩存,可以設置為48KB共享緩存加16KB L1緩存,也可以設置為16KB共享緩存加48KB L1緩存。在之前的GT200核心中,並沒有L1緩存的設計。L1緩存可以用於處理寄存器溢出、堆棧操作和全局LD/ST。過去,GPU的寄存器如果發生溢出,會大幅度增加存取時延。
而Fermi的對手代號R800的HD5870所具備的cache是不可隨便調用的,HD5870的緩存實際上是傳統的Texture cache,只不過現在可以用來臨時釋放結果做LDS(Local Data Share),不可編程,不可操作,不可寫,只讀。所以R800現在是16KB LDS+16KB cache,也就是說專用LDS只有16KB。
Fermi經典特性之線程調度
Fermi架構的另一個重要特性,就是它的雙層分布式調度機制。在片上的層面(SPA Streaming Processor Array,流式處理器矩陣級別),全局的分布式線程調度引擎(global work distribution engine)分發block到每一個SM上,在SM層面,每一個warp分布式調度引擎按照32個線程為一個warp執行。
Fermi實現了SM級別的雙發射,意味著SPMD(單線程多任務)的實現。從並行kernel下探到最底層,實際上就是靠的SM級別的雙發射。SM級別的SPMD上升到GPU核心級別,Fermi就是MPMD(多線程多任務)。這種設計已經越來越像CPU,而且隨著GPU的發展,每走一步,就多像一份。
第一代GigaThread線程調度引擎,在G80架構中實現了12288個線程的實時的調度管理。Fermi架構不只是增強了原有的機制,而且引進了更快的context上下文交換機制,並行kernel執行機制,增強了線程block的調度能力。Fermi的這項能力相對於上一代GPU提高了10倍。
同時像CPU一樣,GPU也可以利用context上下文交換機制來管理多任務的切換,每一個任務都可以用分時的方式利用處理器的計算資源。Fermi的運算流水線經過優化設計,把context上下文的切換時間減少到了10到20毫秒,極大的優化了GPU架構。
Windows7 SP1升級包特性分析微軟在2010年7月14日凌晨公開發布了Windows 7、Windows Server 2008 R2第一個SP升級服務包的Beta測試版本。這次SP1加入的新玩意不少,但最主要的兩個特性全都是面向企業用戶和IT管理員的。不過普通用戶也可以通過升級SP1獲得一些特性與性能提升,下面就讓我們結合收集到的信息為大家簡單講解。
儘管微軟官方對服務包給出了一定的說明,但並不完整,以下是科技博客作者瑪瑞斯·歐依葛根據親身體驗,列舉了一些安裝使用Win 7 SP1時值得注意的要點:
1、Windows 7 SP1 beta中新增哪些功能特性?
很遺憾,本次服務包中除了Win 7 RTM包含的所有功能以及動態內存管理和RemoteFX技術外,沒有在用戶層面增加新的功能。但目前僅是測試版,不排除在後續版本中添加的可能。
2、Windows 7 SP1提供些什麼?
該問題的回答很標準:SP1是為開發者和IT專業人士提供的,旨在改善作業系統的性能並提供現有升級補丁包,更好收集用戶和合作夥伴的反饋信息。
3、安裝SP1前要做哪些準備工作?
只有一點:Windows 7 RTM版作業系統,且測試版僅限五個語言版本分別是英語、法語、西班牙語、德語和日語。
4、Windows 7 SP1測試版的使用壽命是多久?
大約一年。到2011年3月底開始,微軟會發出到期提示,並在6月30日終止支持服務。屆時,舊的系統需要升級到更新的版本比如SP2、SP3等。
5、Windows 7 SP1 RTM(穩定版)能使用多久?
按照慣例,現有軟體的穩定版至少可以在新版出現後延長24個月,折合兩年的壽命。
6、Windows 7 SP1 RTM(穩定版)何時發布?
微軟官方給出的時間大概是2011年第一季度。
7、SP1 beta的目標客戶是哪些?
SP 1公開測試版是為IT專業人士和開發人員量身打造的,作為一款面試不足一年的作業系統,亟需這些用戶開發出更多支持Windows 7的軟體產品。SP1包括32/64兩個版本,且SP1最終版將通過Windows更新服務提供安裝。
8、SP1系統配置最低要求是什麼?
最低需要1GHz以上處理器、1G(32位)/2G(64位)內存、16G/20G磁碟空間、支持WDDM 1.0以上版本的DirectX 9顯卡。
9、SP1 beta能否升級到SP1 RTM?
不可以,用戶需要卸載SP 1測試版後再淨安裝SP 1RTM,該服務可通過每周的Windows Update提供。
10、Vista SP1在市場中的反饋比較糟糕,我們是否應對Win 7SP1同樣持警惕態度?
Windows 7與Vista不同,它具備很多舊版Windows的優點且入市半年多以來較少出現使用故障,兼容性、硬/軟體支持、穩定性均十分出色,至少在目前來說是這樣的,所以還是值得升級到SP1的。
1、支持第三方聯合服務高效通信
也就是那些支持WS-Federation被動配置協議的,從而增強平臺協作性、改進不同組織間的身份和授權信息認證能力。
2、改進HDMI音頻設備性能
有些用戶反映Windows 7 PC在系統重啟後與HDMI音頻設備之間的連接會消失。SP1對此做出了改進,確保二者的連接不再中斷。
3、糾正列印混合方向XPS文檔時的設置
部分用戶反映使用XPS Viewer列印同時包含橫向、豎向的XPS文檔時存在困難,導致整個頁面變成了要麼全部橫向、要麼全部豎向的單一 模式。SP1已經解決了這一問題。
Win 7 SP1的獨有特性還包括路由遠程訪問識別(RRAS和IPSec)的加強,這個特性對於網絡管理員非常有幫助,但普通用戶依然不會經常用到它們。
最後一個就是高級矢量擴展(Advanced Vector eXtensions)指令集的支持,這恐怕是Win 7 SP1對於廣大群眾最有用的一個升級了。AVX指令集是英特爾下一代處理器Sandy Bridge所支持的指令集,它能大大加強處理器的浮點計算能力,在一些浮點運算比較密集的程序(例如3D渲染,高清視頻編碼,3D遊戲)中會獲得顯著的性能提升。
簡單的說,如果某個程序、你的處理器、作業系統都支持AVX指令集,那麼這個程序的運行速度就會快很多。Win 7 SP1的AVX指令集支持就是作業系統這一環。
通過上文分析大家已經了解了,Windows 7 SP1沒有在用戶層面增加任何新的功能,因為原版Win7已經很完美了,微軟要做的只是加強安全性,提高兼容性。不過今天的測試還是充滿懸念,我們測試的Geforce GTX460、GTX580、Radeon HD6870將會在SP1下展現出何種性能提升呢?
性能測試的硬體、軟體平臺狀況
測試系統硬體環境性能測試使用的硬體平臺由Intel Core i7-870 3.5GHz、ASUS P7P55D Deluxe主板和2GB*2雙通道DDR3-1600內存構成。細節及軟體 環境設定見下表:
測 試 平 臺 硬 件中央處理器Intel Core i7-870 OC3.5GHz(4核 / 超線程 / 133MHz*25 / 8MB共享緩存 )散熱器Thermalright Ultra-120 eXtreme(單個120mm*25mm風扇 / 1600RPM)內存模組Apacer 獵豹二代雙通道套裝/PC3-12800(SPD:1757 9-9-9-24-1T)主板ASUS P7P55D(Intel P55 + ICH10R Chipset)顯示卡AMD 產 品Radeon HD 6870(Barts / 1024MB / 核心:900MHz / Shader:900Mhz / 顯存:4200 Mhz)Radeon HD 5870(Cypress / 1024MB / 核心:850MHz / Shader:850Mhz / 顯存:4800 Mhz)Radeon HD 5850(Cypress / 1024MB / 核心:725MHz / Shader:725Mhz / 顯存:4000 Mhz)NVIDIA 產 品GeForce GTX 580 1536MB(GF110 / 1536MB / 核心:772MHz / Shader:1544Mhz / 顯存:4008Mhz)GeForce GTX 480 1536MB(GF100 / 1280MB / 核心:700MHz / Shader:1401Mhz / 顯存:3696 Mhz)GeForce GTX 460 1024MB(GF104 / 768MB / 核心:675MHz / Shader:1350Mhz / 顯存:3600 Mhz)硬碟Hitachi 1T(1TB / 7200RPM / 16M緩存 / 50GB NTFS系統分區)電源供應器AcBel R8 ATX-700CA-AB8FB(ATX12V 2.0 / 700W)顯示器DELL UltraSharp U2410(24英寸LCD / 1920*1200解析度)
Apacer 獵豹二代雙通道套裝/PC3-12800
Thermalright Ultra-120 eXtreme
我們的硬體評測使用的內存模組、電源供應器、CPU散熱器均由COOLIFE玩家國度俱樂部提供,COOLIFE玩家國度俱樂部是華碩(ASUS)玩家國度官方店、英特爾(Intel)至尊地帶旗艦店和芝奇(G.SKILL)北京旗艦店,同時也是康舒(AcBel)和利民(Thermalright)的北京總代理。
桌面環境
2560*1600_32bit 60Hz
測 試 平 臺 軟 件3D合成 測試軟體3Dmark VantageFuturemark / 版本號1.2DirectX 11 理論測試項目DirectX 11 SDK Nbody GravityMicrosoft / 版本號 DemoHDRToneMapping CS11Microsoft / 版本號 DemoOIT 11Microsoft / 版本號 DemoMultiThreadedRendering11Microsoft / 版本號 Demo基準性能測試GPCBenchMarkOCLHPC Tech / 版本號1.1輔助測試軟體Frapsbeepa / 版本號 3.2.3各類合成測試軟體和直接測速軟體都用得分來衡量性能,數值越高越好,以時間計算的幾款測試軟體則是用時越少越好。
DX10理論性能測試:3Dmark Vantage特性測試3DmarkVantage是Futuremark最新推出的一款顯卡3D性能測試,該款軟體僅支持DirectX 10系統及DirectX 10顯卡。測試成績主要由兩個顯卡測試和兩個CPU測試構成,整個測試軟體各家偏重整機性能。
我們本次測試使用了3DmarkVantage的6個子項測試,這些子項可以很好地體現GPU的圖形處理特性,也可以發現不同GPU架構對於不同渲染場景的適應性。
DirectX 11 SDK Nbody GravityDirectX 11 SDK Nbody Gravity項目源於Nbody仿真,它在數值上近似地表示一個多體系統的演化過程,該系統中的一個體(Body)都持續地與所有其他的體相互作用。一個相似的例子是天體物理學仿真,在該仿真中,每個體代表一個星系或者一個獨立運行的星系,各個體之間通過萬有引力相互吸引,如圖所示。
在很多其他計算機科學問題中也會用到N-body仿真,例如蛋白質摺疊就用到Nbody仿真計算靜電荷範德華力。其他使用N-body仿真的例子還有湍流流場仿真與全局光照計算等計算機圖形學中的問題。
HDRToneMapping CS11
HDRToneMapping CS11測試項目同樣是針對Computer Shader能力進行測試,該項目展示了如何設置和運行計算著色器(Computer Shader),這是最令人興奮的Direct3D 11的新功能之一。雖然該測試只是檢驗了這項技術在HDR(High-Dynamic Range)高動態光照渲染中的加速能力,但是這個概念應該很容易擴展到其他後處理算法,以及更一般的計算。
這項測試我們選擇了DirectX 11所推薦的Computer Shader渲染模式,在測試中NVIDIA顯卡出現了負載不飽和狀態,所以整體得分不理想。聯繫到NVIDIA在Fermi架構中對並行計算的支持和多級多分配多線程能力,這個得分還是比較讓人失望的,我們只能希望NVIDIA通過新驅動開發繼續優化帶有緩存的Fermi架構。
OIT11示例演示了在Direct3D 11獨立透明度的技術。換句話說,基元(Primitives),可以得出在任何秩序,透明度將正確處理。該技術提供的作品,因為它們是由緩衝透明的像素。這些像素,然後按深度,並在後端到前端與tranparency秩序呈現。本示例使用計算著色器生成一個前綴之和排序前最後的渲染的像素片段。
MultiThreadedRendering11單線程MultiThreadedRendering11項目是一個典型的多線程渲染測試,此示例說明了如何提升多線程環境中的分割渲染效率。全新的Direct3D 11渲染功能的核心,擁有一個駐留在D3D設備的新接口,稱為D3D設備上下文。
D3D設備上下文可以完成兩種效果之一:立即或延遲。一個直接的上下文命令直接提交到設備驅動程序,如傳統的渲染。遞延範圍內分批為在命令列入名單的命令,該命令列表可以執行在任何時候通過一個即時的範圍內,可能在不同的線程運行。
第一部分的測試使用了單線程模式,線程數量可以在程序中自動控制。我們通過監控任務管理器看到單線程模式下,一顆4核心CPU的佔用率大約在25%。也就是說只有一個CPU核心帶領GPU執行渲染任務,這是以往DirectX的渲染模式。
MultiThreadedRendering11多線程MultiThreadedRendering11項目是一個典型的多線程渲染測試,此示例說明了如何提升多線程環境中的分割渲染效率。全新的Direct3D 11渲染功能的核心,擁有一個駐留在D3D設備的新接口,稱為D3D設備上下文。
D3D設備上下文可以完成兩種效果之一:立即或延遲。一個直接的上下文命令直接提交到設備驅動程序,如傳統的渲染。遞延範圍內分批為在命令列入名單的命令,該命令列表可以執行在任何時候通過一個即時的範圍內,可能在不同的線程運行。
第二次測試我們開啟了多線程渲染模式,我們看到CPU佔用率提升到了50%左右,其中一顆核心負載將近100%,其他核心負載也相應有所提升。
首款國人開發的支持GPU的OpenCL通用計算測試程序OpenCL General Purpose Computing Benchmark (簡稱GPCBenchMarkOCL)是由國內幾名高性能計算從業人員和愛好者合作編寫的,目的是為了評估在不同的OpenCL平臺上一些基本算法和應用的性能。
與目前流行的一些OpenCL、DirectCompute通用計算測試程序的不同在於,目前這些測試程序測試項目過於單一,基本上就是某一兩種算法的性能測試,甚至乾脆就是理論峰值計算性能的測試。而GPCBenchMarkOCL軟體可以進行帶有針對性的多個項目的具體測試,對運算和吞吐各有側重。
Win7 SP1測試之3DMarkVantage3DmarkVantage是Futuremark推出的一款顯卡3D性能測試,該款軟體僅支持DirectX 10系統及DirectX 10顯卡。測試成績主要由兩個顯卡測試和兩個CPU測試構成,整個測試軟體各家偏重整機性能。
我們本次測試使用了3DmarkVantage的6個子項測試之中的3個,這些子項可以很好地體現GPU的圖形處理特性,也可以發現不同GPU架構對於不同渲染場景的適應性。
Win7 SP1測試之多線程渲染MultiThreadedRendering11項目是一個典型的多線程渲染測試,此示例說明了如何提升多線程環境中的分割渲染效率。全新的Direct3D 11渲染功能的核心,擁有一個駐留在D3D設備的新接口,稱為D3D設備上下文。
D3D設備上下文可以完成兩種效果之一:立即或延遲。一個直接的上下文命令直接提交到設備驅動程序,如傳統的渲染。遞延範圍內分批為在命令列入名單的命令,該命令列表可以執行在任何時候通過一個即時的範圍內,可能在不同的線程運行。
測試總結:通過本次測試我們了解到了Geforce GTX580的各項特性,在確認半導體工藝能夠穩定支撐全規格的Fermi架構之後,NVIDIA提高頻率並且補全規格,這就是現在展現在我們面前的Geforce GTX580。
微軟此次放出的Win7 SP1雖然旨在提升安全性和兼容性,但我們在性能測試中還是找到了一些難得的提升,特別是在GF104核心的Geforce GTX460產品多線程渲染測試部分,我們發現全新的升級包帶來了可觀的性能增益。
【免責聲明】本文僅代表作者本人觀點,與和訊網無關。和訊網站對文中陳述、觀點判斷保持中立,不對所包含內容的準確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,並請自行承擔全部責任。