在2005年英特爾Pentium D處理器把我們帶進了多核多線程的世界,2006年英特爾又首先推出65nm基於Core架構的四核處理器。到目前為止,四核處理器在中國已經出貨超過100萬顆。隨著多核產品的推廣,而桌面級的多核應用也開始萌芽,Divx、Sony Vegas、3DS MAX9等產品已經現實多線程優化,人們可以在這些「先驅軟體」中體驗到多核處理器帶來的並發執行優勢。這些都表明了:消費級高效計算依然在保持著高速發展態勢,更多的Server級應用正在往消費級遷移,並行處理、虛擬化、高級內存管理技術等對處理器提出了更好的要求。而High-k 45nm新技術的推出,使電晶體的性能提升~20%,漏電流降低90%。在相同的架構下,High-k 45nm 的處理器性能大大提升,同時功耗大大降低。
Intel於今年第一季度發布了High-k 45nm Penryn四核心的最低價產品:Core 2 Quad Q9300,代替目前的65nm Q6600成為入門級四核處理器。和Q6600相比,官方定價同樣為266美金,而Q9300將前端總線提升到了FSB 1333MHz,主頻為2.5GHz。目前的3系列晶片組都能支持FSB 1333MHz,到時Intel還會發布4系列晶片組全面支持High-k 45nm處理器。
自酷睿架構產品發布以來,英特爾處理器在高端市場的優勢越來越明顯。尤其是High-k 45nm Penryn推出,更是沒有對手。
Q9300的CPU-Z檢測信息。由以上截圖我們可以看到,Intel Core 2 Quad Q9300的核心研發代號為Yorkfield,採用45nm製程工藝生產,C0步進,支持SSE4.1多媒體指令集,2x3M的二級緩。
由於全面支持High-k 45nm CPU的Intel 4系列晶片組的要在今年二季度推出,此次採用已發布的Intel P35原裝主板來測試。
【→測試平臺以及說明←】組件 | 配置 |
處理器 | 英特爾 酷睿2 四核Q9300 |
主板 | 英特爾 DP35DP |
晶片組 | P35 + ICH9 |
內存 | 威剛(紅色威龍) DDR2-800 1G x 2 |
硬碟 | 希捷 7200.10 250G |
顯卡 | NVIDIA Geforce 8800GTS |
顯示晶片驅動版本 | Forceware Release 169.25 |
散熱系統 | CPU盒包風扇 |
作業系統 | Windows Vista Ultimate 32-bit |
在本次測試過程中,我們將使用簡體中文版Windows Vista Ulitmate 32-bit版本的作業系統,利用Vista 「SetAffinity...」可以關閉任意內核的功能來比較同頻四核對比雙核的性能優勢。即Q9300工作在雙核和四核的時候,其軟體與硬體都相同的情況下。本測試並不對作業系統進行任何優化,用以獲取最大的系統穩定性與兼容性。所有測試軟體運行過程中均使用「Vista」默認桌面主題和「最佳效果」,關閉屏幕保護、休眠、系統還原以及自動更新等功能,並統一使用公版主板和顯示晶片組驅動程序,為獲取最為真實原始的客觀評測數據提供基礎。
對於測試工具,本次測試有別於常規的3DMark, PCMark的測試。本次採用Cinebench10,光線追蹤、DX10遊戲失落的星球(Lost Planet)、影視剪輯快手(VirtualDub)來分別測試。分別對應圖形處理性能,未來遊戲引擎性能,DX10遊戲性能以及SSE4功能的測試。相比3Dmark, PCMark更具有針對性和實用性。
【→性能測試部分←】
1. Cinebench10 演示
Cinebench10 是一項測試圖形渲染的軟體,主要測試的是CPU的渲染能力。在目前的工業和專業圖形設計以及個人圖像編輯中都用到大量的渲染功能。由於涉及到大量的運算工作,目前很多的專業圖形設計都是使用了專業的雙路伺服器來做運算平臺,即便如此有的渲染工作還是需要幾天甚至一個多星期的時間。
點擊左側的「Rendering (xCPU)」開始測試,
這是四個內核在同時工作的情形。
測試完成後,會觀察到測試時間和得分,如下圖所示:
在四核同時工作的時候,渲染花了91秒 的時間。
• 現在,按「Ctrl+Alt+Delete」打開任務管理器,點擊「Processes」,找到進程「CINEBENCH R10.exe」,右擊該進程,選擇「SetAffinity...」,在彈出的對話框中將「CPU2」「CPU3」前面的勾去掉,點擊「OK」保存修改,如下圖所示:
此時,進程「CINEBENCH R10.exe」就只有兩個內核在工作了。CPU工作主頻是一樣的,軟體和硬體平臺都完全一樣。
重新點擊左側的「Rendering (xCPU)」,開始測試,觀察測試時間和得分,並將該結果與四核同時開啟時運行的結果進行對比,參考結果見下圖:
這時,關閉兩核的Q9300花了171秒的時間才渲染完同樣的一幅圖。
2. 光線追蹤(Ray Tracing)。看過《指環王》電影的玩家都會為電影中恢宏的場景以及逼真的人物造型所震撼,但如果電腦遊戲中也能實現像《指環王》電影中一樣的場景會怎麼樣呢?絕對真實的光線效果、完全仿真的紋理皮膚、遊戲中的所有一切都仿佛真實生活中的一切…
一項名叫光線追蹤(Ray Tracing)技術就可以幫助我們實現以上的夢想,該技術在Quake3:Ray Tracing、Quake4中已成功應用。
我們利用FRAPS來測試光線追蹤的FPS速度.
• 可執行文件「arauna」開始運行光線追蹤程序,可以得到50FPS的速度,如下圖所示:
• 按「Ctrl+Alt+Delete」打開任務管理器,點擊「Processes」,找到進程「arauna.exe」,右擊該進程,選擇「SetAffinity...」,在彈出的對話框中將「CPU2」「CPU3」前面的勾去掉,點擊「OK」保存修改,如下圖所示:
• 此時,FPS顯著下降,只有27FPS, 如下圖所示:
下面的測試時DX10遊戲的測試。
3.失落的星球(Lost Planet). 利用其「PERFORMANCE TEST」的測試。其中有兩個測試的場景「Snow」 和 「Cave」,「Snow」 主要測試顯卡的性能,而「Cave」主要測試CPU的性能。
四核同時工作的時候, 「Snow」 和 「Cave」 場景的FPS分別是91FPS 和 70FPS
同樣利用打開任務管理器的 「SetAffinity...」選項關閉兩個內核,同頻雙核的結果如下:
Snow場景FPS沒有改變, 而Cave 得分只有47FPS.
4.SSE4指令集測試
我們知道2008年底之前,只有Intel的45nm 才有SSE4指令集. SSE4指令集是在現有Intel Core架構的SSE3基礎上新增加了47條多媒體指令。到底SSE4的性能相比SSE2,SSE3有多大的提升呢?
我們利用了影視剪輯快手(VirtualDub) V1.7.6來測試具有SSE4指令集的Q9300的性能。
我們選擇了一段NBA的MPEG視頻,將其轉換為AVI的格式。
選擇「Video—>Compression…」,彈出對話框,選擇「Divx?6.7Codec(4 Logical CPUs)」,然後點擊「Configure」按鈕,如下圖所示:
• 選擇「File—>Save as AVI...」,在彈出的對話框中改變文件另存為的目錄(桌面)和文件名,單擊「Save」開始文件轉換,如下圖:
使用SSE2的選項(四核運行),需要1分12秒的時間做轉換。
按照前面的方法重新配置Codec,如下圖所示:
這時,使用SSE4的選項時(四核運行),只需要57秒的時間就可以將此段視頻轉換完成。
【→測試總結←】
| 雙核 | 四核 |
圖像渲染Cinebench10(時間越少越好) | 171秒 | 91秒 |
光纖追蹤(數值越大也好) | 27FPS | 50FPS |
失落星球-DX10遊戲(數值越大也好) | 47FPS(cave) | 70FPS(cave) |
Intel Core 2 Quad Q9300在同頻四核和雙核上的測試中,四核在圖像處理,未來遊戲性能和DX10遊戲性能上,四核相比雙核性能分別提升了~100%,95%,50%。可見IT業的應用將會越來越依賴於多核的處理器。
另外,由於High-K 45nm具有SSE4的多媒體指令集。在多媒體處理無疑又增加了砝碼。(在上面的測試上,SSE4相比SSE3提升20%的性能。)
至今為止英特爾已經擁有QX9770、QX9650、QX9770、 Q9550、 Q9450、Q9300六款High-K 45nm的四核處理器,給用戶充分的選擇空間。由於目前的四核產品價格較高,此款入門級的High-K 45nm Q9300無疑成為市場的首選。