·Santa Rosa Refresh開始嶄露頭角
還記得在2007年年中的時候,英特爾一舉推出了採用Merom核心且接口為Socket P的Core 2 Duo處理器、965系列晶片組、4965AGN無線網絡模塊以及創新性的迅盤模塊。這四大主要配件的推出徹底地將筆記本平臺拉至了第四代,這也直接導致了從2007年6月份開始至今,「迅馳4」、「Santa Rosa」等這些名字幾乎成為人們餐前飯後的家常話題。
當然對於半導體類產品來說,摩爾定律就是其發展方向,並且以現在的趨勢來看半導體產品的發展速度也早已突破摩爾定律18個月為一個翻倍周期的「限制」。就在消費者沒還未對迅馳4平臺充分的進行品嘗的同時,英特爾就更加快速的在2008年1月8日推出了迅馳平臺的升級版。與早先代號為NAPA的迅馳3代平臺升級後的代號相同,本次迅馳4平臺的升級也同樣被稱為Santa Rosa Refresh。
45納米Penryn核心Core 2 Duo T9300處理器現身
不過與之前推出迅馳4平臺時的萬馬千軍不同,本次Santa Rosa Refresh平臺的推出僅是對處理器部分進行了較大的調整,將原先採用65nm製程的Merom核心處理器直接升級到了採用45nm製程的Penryn核心處理器。
Core 2 Duo T9300處理器
這也使2008年1月份的筆記本市場與一直被期待的代號為Montevina平臺更近了一步。在電晶體數量上,45nm的雙核心Penryn處理器在65nm Merom處理器2.93億個的基礎上提高到了4.1億個。
這次英特爾借Santa Rosa Refresh平臺帶來了5款新處理器,分別以T8XXX與T9XXX來命名,其中還包括一款X9000頂級處理器。需要說明的是,由於晶片組並沒有改變所以這次新近推出的5款處理器均同樣採用了Socket P接口。也正是介於此,對於許多採用了965系列晶片組的舊平臺來說,本次針對Santa Rosa Refresh平臺完全可以達到平滑升級。
Core 2 Duo T9300處理器採用了與Merom核心處理器相同的Socket P插槽
但據業內人士稱:如果想要穩定的運行Penryn處理器,則需要給主板 額外添加一顆專用晶片。但至於這塊晶片到底用在何處,目前並不明了。但編輯猜測該晶片應當與處理器供電有關。
Penryn平臺能夠運行Merom 證明兩者基本上可以通用
採用標準相同的Socket P插槽
這樣的設定打破了當前迅馳4平臺升級45nm Penryn的夢想。不過也不排除第三方廠商通過BIOS對處理器內部某些功能進行限制以達到平滑升級的目的。不過在評測的同時,編輯將一顆T7250處理器安裝在Penryn的平臺上,筆記本完全能夠正常啟動且運行相應的測試軟體。
目前已推出採用Penryn核心處理器 | ||||
型號 | 主頻 | 二級緩存大小 | 前端總線頻率 | 所屬平臺 |
Intel Core 2 Duo T8100 | 2.1GHz | 3MB | 800MHz | Santa Rosa Refresh |
Intel Core 2 Duo T8300 | 2.4GHz | 3MB | 800MHz | Santa Rosa Refresh |
Intel Core 2 Duo T9300 | 2.5GHz | 6MB | 800MHz | Santa Rosa Refresh |
Intel Core 2 Duo T9500 | 2.6GHz | 6MB | 800MHz | Santa Rosa Refresh |
Intel Core 2 Duo Extreme X9000 | 2.8GHz | 6MB | 800MHz | Santa Rosa Refresh |
另外本次對處理器的提升比較明顯的地方就是二級緩存部分的擴容。在發布的兩款T8XXX處理器中,二級緩存被提升至了3MB;而T9XXX與X90003款處理器的二級緩存則為6MB。更大的二級緩存將為數據帶來更多的預讀機會從而有效的提升系統運行速度。
Core 2 Duo T9300處理器正面與背面特寫
拜45nm所賜,我們可以看到Penryn核心的處理器在內核面積上已經較Merom處理器有了相應的縮小,這在一定程度上給未來處理器的成本降低提供了可能。另外,我們也發現處理器背面的貼片元件也有所改變,最大的差別是兩者陶瓷電容以及電阻的數量比例發生調換。
核心尺寸測量 明顯看出Penryn處理器的核心較小
對比背面的貼片元件也有所不同
在2007年11月16日的時候,英特爾正式向業界推出了採用45nm製程的半導體成品。而本次新技術的全稱為「英特爾45nm高K金屬柵矽製程技術」,是半導體行業近40年來的重要創新。這一製程技術的創新,也令是英特爾TICK-TOCK產品發展戰略更加向前邁進了一步。
在早先的半導體產品中,業界一向採用二氧化矽作為電晶體柵的主要介質。比較顯著的是在原先65nm製程中,英特爾已經成功的將以二氧化矽作為主要介質的電晶體柵壓縮到了僅有5個原子厚的1.2nm。在人們被這種近乎奇蹟的先進技術所折服的同時,英特爾本身也在該方面遇到了問題,那就是過薄的二氧化矽柵介質導致了上層柵極漏電率的大幅度提升。實際上這也是傳統的二氧化矽技術所遇到的「極限」。
45nm的基礎 High-K+Metal Gate的新材料革新
正是由於這種原因,被摩爾定律所「驅趕」的英特爾在新的45nm產品中引入了「High-K」技術。新技術採用了鉻元素為主要材質,其較以往二氧化矽有著更好的絕緣性以控制來自於電晶體柵極的漏電。但是由於與原先電晶體介質完全不同,所以英特爾也拿出了相應的柵極材料增大了20%以上的源頭至漏極驅動電流,同時不但將電晶體效能進行了提升還將源極至漏極之間的漏電率降低5倍之多。當然,對於這個具有豐功偉績的材料,英特爾將其命名為「Metal Gate」,但並沒有將其所使用的合金材料的具體細節進行公布。
顯微鏡下 神秘材質的外貌
High-k柵介質與Metal Gate柵極的引入能夠使得電晶體漏電率較之傳統材料降低10倍以上,與65nm製程工藝相比能夠在相同耗能下提升20%的時鐘頻率亦或是在相同時鐘頻率下擁有更低的耗能。45nm晶片每秒鐘能夠進行約三千億次的開關動作,在以銅與low-k材料搭配組成的內部連接線的作用下,晶片開關速度能夠提升20%且耗電量降低30%。
45nm Penryn處理器內核外貌
並非只有進程方面的提升,與Merom及前一代處理起比起來,Penryn處理器的變化是相當大的。而相對於抽象的材質變更來說,多媒體指令集以及功能方面的提升顯得更加令人激動。需要說明的是,雖然英特爾給45nm的Penryn處理器加入了多項全新的設計並把它們統稱為增強型酷睿微架構,但是與早先的Merom處理器相同,其仍舊屬於酷睿家族的一員。
·勞苦功高的SSE多媒體指令集
眾所周知,在第一代多媒體指令集MMX被推出以來,幾乎每隔幾代處理器英特爾都會對其內置的多媒體指令集進行更新。而目前英特爾的第五代Streaming SIMD Extension 4(SSE4)指令集除擴展Intel 64位指令外,還新增對於影像編輯、視訊編碼、三維渲染以及遊戲應用等方面的指令,使得處理器的效能更進一步。
新一代SSE4多媒體指令集
本次升級的第五代SSE4多媒體指令集將分為SSE4.1以及SSE4.2兩個版本,而這次Santa Rosa Refresh平臺所升級的Penryn處理器則使用了其中的SSE4.1指令集。更新後的SSE4.1多媒體指令集共增加了47條指令並且引入了兩組不同的32-bit向量整數乘法運算單元能夠對八位無符號最大值以及最小值運算提供支持。另外新加入的16-bit/32-bit有符號和無符號運算支持,能夠有效改善編譯器執行效率並提升向量整數以及單精度代碼的運算能力。
SSE4.1多媒體指令集共增加了47條指令
不僅如此新加入了6條浮點型點積運算指令的SSE4.1已經能夠對單精度、雙精度浮點運算及浮點產生操作提供支持,且額外的IEEE 754指令(包含Nearest、-Inf、+Inf、與Truncate) 也可以保證轉換路徑模式立即運行,在減少了系統延遲時間的同時也對3D應用給與了極大的便利。
得益於以往SSE多媒體指令集的優勢,處理器在視頻編碼上也頗具優勢。本次的SSE4.1多媒體指令集中增加的串流式負載指令,能夠提高圖形幀緩衝區的讀取數據帶寬,可以在理論上獲得更加完整的緩存行並以64位元組的數據線寬讀取顯卡幀緩衝區,相較以往的8位元組架構有很大程度的速度提升。
·超級Shuffle同樣功不可沒
僅僅擁有新的多媒體指令集仍舊不夠,Penryn處理器內置的超級Shuffle引擎和SSE指令集能夠相互關聯,使多媒體指令運算效率獲得較大幅度的提升。
超級Shuffle引擎效果驚人
以往在處理128位寬度的字節、字以及Dword SSE數據時,處理器並不能將這些整合在單一周期內運行,必須將一個128位數據拆成2個64位進行處理器,當然再加上處理數據的時間則一共需要2個周期。但超級Shuffle引擎設計可以允許處理器在不經過軟體部分改良的基礎上將多種性質的128位SSE指令放在1個周期內完成。
·新一代Radix-16處理器賦予Penryn更快的速度
在擁有酷睿架構的一系列優點之外,新的45nm Penryn處理器進一步的改良了除法器的設計,對比早先的產品提升了約2倍左右的性能。新的除法器被稱為「Radix-16」,對比以往的Radix-4或者Radix-2除法器,後者在單一周期內只能傳遞2bit數據,而新的快速Radix-16除法器則可以傳遞4bit數據。
新一代除法器:Radix-16
也就意味著Penryn處理器能夠達到單周期處理多達4個指令,並且14層流水線設計也提升分支預測的能力及準確性,分支預測的帶寬提升至20byte (K8、Banias 為16byte,Netburst為4byte),令指令執行效率大大提高。新的Radix-16除法器在大幅改善寬位動態執行的效率的同時,也在加速浮點以及整數的除法運算速度,在針對科學計算、數學運算以及3D坐標的轉換中有著較大程度的提高。
說到快速作業系統原語支持是指,當作業系統遇到臨時阻礙、遮蔽中斷指令且影響關鍵代碼區段,或者是類似輸入輸出設備需要獨佔存取等情況的時候,處理器可以快速的中斷遮蔽控制機能,清除以及重置中斷,並快速進、出此狀態模式,大幅改善該類型操作。基於此,Penryn可以快速執行XCHG、ADD、XADD、NEG、BTS、AND、CMPXCHG等鎖定指令,以及快速存取讀取時間印記計數器。英特爾稱:快速作業系統原語支持技術可提高2倍的執行效率,對資料庫伺服器、交易處理伺服器等應用有特別明顯的性能提升。Intel經由強化微架構設計,縮短VT-x指令轉換虛擬主機進入、離開時間,無須修改現有虛擬主機軟體,就能增加25%~75%的執行效率。
·小群組擁有大能力,Associativity技術大幅提高緩存命中率
對於處理器另一個重要的部分,相信很多資深的DIY玩家會選擇其高速二級緩存。對於處理器來說,高速二級緩存是介於處理器與系統之間的一個緩衝區,處理器會對緩存內的數據進行預讀以提高程序及指令的運行效率。新的45nm Penryn處理器在高速緩存上加入了一種「小群組」概念並稱其為「Associativity」,該技術將高速緩存分割成多個區塊。這樣做的好處是可以加速數據讀出以及寫入,而不用在容量日趨增大的緩存中對數據進行查詢。
Associativity技術將緩存分組
由於這種小群組的個數跟快取失誤率及額外的延遲時間有關,所以小群組的數量越多便能夠降低數據覆蓋的機率,減少快取失誤機率從而提高命中率。相比以往的16路設計,Penryn處理器在此基礎上增加到了24路,以目前Penryn處理器的二級緩存數量來看,理論上可以更加進一步的降低失誤率。
需要說明的是,這種「Associativity」也是一柄雙刃劍。處理器會因為緩存中小群組數量過多,會逐一的按照群組對數據進行查詢,這樣的後果就是延遲時間不但不會縮短,反而會變得更長。
採用Associativity技術後的緩存效果增長
另外在本次推出的5款Penryn處理器中並不是所有的型號都具備有24路Associativity技術,其中內置有3MB緩存的Core 2 Duo T8100與8300就只有12路Associativity,而二級緩存為6MB的T9300與9500才擁有24路組聯。
·增強型Store Forwarding技術讓處理器提前加載結果
Penryn處理器也在為進一步改善系統內存性能做出了不小的貢獻。在早先Merom核心處理器只能做到內存訪問的基礎上,Penryn加入增強Store Forwarding功能。該項功能可以加速讀取管線中超過8位元組地址範圍的儲存結果。讓處理器不必等待結果寫入內存中就能提前加載儲存結果,有效地降低延遲。
·C6深度睡眠 讓筆記本電腦續航能力更長
功耗控制是針對移動平臺處理器的一個較大問題。由於筆記本電腦等行動裝置所裝備的鋰離子電池容量有限,所以一款能夠對功耗有著完美控制的處理器就顯得頗為必要。相比較以往,45nm的Penryn處理器加入了Enhanced Deeper Sleep C6模式與Enhanced Dynamic Acceleration Technology(增強型動態加速技術)。
深度睡眠 讓處理器更加節能
「深度電源關閉技術」是一個全新的處理器空閒電源管理技術,可讓處理器的功耗在空閒狀態下核心電壓大幅度降低,同時緩存中的數據會被轉移並將其完全關閉。由於全新的休眠方式可以進一步降低處理器核心電壓並關閉所有的緩存,所以能夠為筆記本電腦帶來更加顯著的續航時間按。
45nm Penryn處理器
但事有利弊,處理器從節能到全速運行需要一個轉換的時間,儘管這個時間還是相當短暫的,但依舊會成為對性能的一個影響因素。不過我們也有理由相信,對比更長的續航時間,些許的等待應該也是值得的。
介紹到這裡,相信很多朋友已經對新款的Penryn處理器以及頗感興趣了。相信最近大家也已經看到了許多關於Penryn家族中T8XXX系列處理器的評測分析,而最近編輯獲得了由華碩提供的一款帶有英特爾Core 2 Duo T9300處理器的R1E筆記本電腦。這顆Core 2 Duo T9300處理器具有2.5GHz的主頻、6MB高速二級緩存以及800MHz的前端總線頻率。該處理器所標成的熱功耗(TDP)為35W。
CPUZ 處理器信息摘要
作為測試平臺的華碩R1E採用了英特爾GM965+ICH8M的晶片組搭配,2GB系統內存、5400rpm 250GB SerialATA硬碟並配有1GB迅盤模塊。華碩R1E測試平臺詳細配置見下表:
測試平臺硬體配置 | |
型號 | 華碩R1E |
處理器 | Intel Core 2 Duo T9300 |
晶片組 | Intel GM965+ICH8M |
內存 | 2GB DDR2 667 |
硬碟 | 250GB SerialATA 5400rpm |
由於整體評測時間相當短暫,所以本次對處理器性能的評測將僅採用PCMark05、3DMark06(CPU Score)以及CINEBench R10這幾款軟體對Core 2 Duo T9300的實際使用效能進行相應的對比評價,評測基於英文Windows Vista 旗艦版作業系統。
作為測試平臺的華碩R1E筆記本
該筆記本採用了英特爾 Core 2 Duo T9300處理器
Penryn核心英特爾Core 2 Duo T9300處理器
其中物理評測部分將採用紅外線測溫儀對同時運行2個SP2004(雙核心100% 佔用率)1小時後的溫度進行測量,並在關閉SP2004待機30分鐘後的溫度進行溫度的再次測量。
眾所周知PCMark05以及3DMark06均出自Futuremark公司之手,兩款整合性軟體可以以其不同的角度對處理器性能給出相應的得分。需要指出的是3DMark06的CPU score子項是根據處理器對3D圖形的渲染能力來作為考量處理器性能的手段。
PCMark05 CPU Score測試 3DMark06 CPU Score測試
PCMark05 CPU Score最終成績柱狀圖
3DMark05 CPU Score最終成績柱狀圖
根據最終的成績的柱狀圖可以看到同為Penryn核心的T9300以及T8300均比較明顯的高於原有Merom核心的處理器,儘管這種提升並非是壓倒性的提升,但是對於目前尚處於工程測試階段的Penryn處理器來說,獲得這樣的成績也可以接受。
CINEBench的測試是完全基於處理器對一幅3D圖片進行渲染,並以此為基礎給目標處理器的最終性能表現進行打分。測試過程分為對單核心運算能力測試以及多核心協同運算能力測試。
CINEBench R10處理器性能評定工具
CINEBench R10最終成績柱狀圖
通過測試我們發現,T9300對比T8300處理器的提升並不十分明顯,而提升部分也只是對應T9300較T8300高出的100MHz主頻。不過需要指出的是,對比早先的Merom核心處理器可以看到,新的Penryn處理器還是有著十分明顯的優勢。相信在未來更多軟體能夠與之相配的時候,採用了Penryn處理器的系統將會有著更好的性能表現。
·處理器發熱量對比測試
衡量處理器優劣另一個指標的就是其發熱量。通過SP2004這款軟體能夠對單一處理器核心進行100%的佔用,所以測試過程中同時打開2個SP2004將可以完全將處理器兩顆核心的佔用率拉至100%。以此為基礎,令處理器全負荷運行1個小時後對其進行相應的溫度測試,並在關閉SP2004待機30分鐘後對處理器低負載溫度進行測試。
溫度測試柱狀圖
對比T8300、T7700以及T7300我們可以看到T9300在這3款處理器面前處於一個中遊偏上的位置。由於T9300主頻較高,所以在溫度方面高於2.4GHz主頻的T8300。對比早先的Merom核心處理器,Penryn在溫度上控制得相對不錯。儘管T9300仍舊在60以上,但是對比Merom核心中高端的T7700來說,還是已經低了不少了,要知道在主頻方面T9300已高於T7700 100MHz。
就像前面所說的,由於測試時間相當有限,所以對於Super PI以及H.264的測試並沒有與其它型號處理器做對比測試。Super PI是基於對小數點後100萬位運算來衡量處理器整體的科學運算能力。
擁有完整複寫引擎的MainConcept H.264能夠進行高質量的編碼和解碼,可以對H.264、AVC以及MPEG-4等多種高級視頻編碼格式進行轉換編碼。測試所使用的視頻片斷基於Mpeg格式,5分鐘的視頻節目速率為5448kbit/s。
Super PI 104萬位處理器性能測試
由於沒有進行與其它型號處理器的對比,所以編輯僅對單一測試成績進行說明。讀者可以根據前面所介紹的平臺配置,自行與其它評測中處理器所得分數進行對比。
H.264處理器硬體編碼測試
根據截圖我們可以發現,Penryn處理器在針對Super PI104萬位運算中僅耗時18秒,相比以往所測試過的T7700處理器的21秒而言提升14%左右的性能。而在H.264的測試中,Penryn處理器則跑出了348秒的不錯成績。實際上將348秒的H.264編碼成績與以往不同款處理器的測試結果相比,已經有了相當大的優勢了,可見新加入的SSE4.1多媒體指令集可以有效的提升多媒體編碼能力。
Penryn處理器的出現在表明了二氧化矽柵極終結的同時也表明了一個處理器新世紀的開始。屆時45nm將會成為一個新的開始,在未來也許我們會在摩爾定律的指引下,看到32nm、16nm等更加先進的工藝,而也將直接導致處理器性能的攀升。
45nm Penryn處理器
另外Penryn處理器的出現也讓人們初窺了第五代迅馳平臺Montevina的冰山一角。相信2008年Montevina的上市將會帶給我們更加令人眩目的性能提升,在那個時候,同樣採用了45nm Penryn處理器的Santa Rosa Refresh平臺將退居二線以更低的價格主打中低端市場。
由45nm帶給我們的驚喜決不僅限於此,它的出現意味著移動平臺的性能被再一次重新進行拓展……