前不久,UserBenchmark跑分測試的資料庫中出現一款名為「Ryzen 7 4800U」的低壓處理器,8核心、16線程,其跑分成績達到了單核138分,全核1074分(搭載該處理器的筆記本型號為HP EliteBook 845 G7 Notebook PC[1])。這個分數在處理器中是什麼量級呢?Intel去年年中發布的、定位筆記本產品的標壓旗艦處理器Core i9-9980HK(TDP 45W)在UserBenchmark資料庫中的跑分為單核128分,多核1101分。
要知道,Ryzen 7 4800U是來自AMD的定位超級本TDP 15W的低壓處理器。這其中令人驚奇的點有兩個。其一Ryzen 7 4800U是AMD的低壓處理器,其跑分成績已經和Intel九代酷睿的筆記本標壓處理器相似;
其二,目前採用Intel最新的十代酷睿低壓處理器Core i7-10710U(6核心、12線程),在UserBenchmark的用戶提交得分資料庫中,最頂尖的得分是143分/910分(所有用戶提交平均分115分/638分)[2]。由於AMD Ryzen 7 4800U的頻率更低,所以理應拿來做對比的應該是4700U,無奈尚無4700U的成績,所以單核性能沒有很好的參照。但至少AMD定位筆記本的低壓處理器,已經部分達到或超過了Intel的同代競品,這在過去十幾年都是相當罕見的,尤其是高端市場的競爭。
當然,我們之前針對筆記本散熱的探討文章[3]就已經提過,討論低壓處理器的性能需要極大程度考慮設備的系統設計,包括運行功率、散熱設計等。Ryzen 7 4800U並未正式上市,UserBenchmark資料庫中的這個搶跑成績,除了數字之外,沒有透露任何信息。所以我們並不清楚這個成績究竟是怎麼跑出來的,以及是否能夠反映實際運行環境。
只是無論如何,AMD自2017年以來發動的這波攻勢,大概都是Intel始料未及的,畢竟Intel穩坐PC處理器市場頭把交椅已經有十多年之久,並且始終在技術、產品表現上相比AMD有著碾壓級別的優勢。
AMD在2017年發布初代Zen架構以後,十多年來第一次在處理器性能上有了與Intel叫板的資本,而且還保持了傳統的性價比優勢。因此,我們對當前PC處理器市場進行了一次簡單的梳理,有關市場分析的詳情可參見即將發布在3月刊《國際電子商情》的文章。這裡援引其中的一部分數據:上個月有不少媒體撰文提及,AMD的PC處理器市場份額已經逼近40%。
實際就統計機構Mercury Research的歷史數據來看,AMD在這塊市場的季度出貨量佔比常年徘徊在10%左右,近九成市場長期被Intel把持。如果AMD能在短短兩年不到的時間裡將市場局面扭轉至40%,那也絕對稱得上是逆襲了。不過實際情況恐怕並沒有這麼美好。40%這個數據的出處,是一個基準測試平臺PassMark[4]。它統計的是每個季度,提交跑分成績的用戶數量。
來源:PassMark[4]
上面這張圖是PassMark統計自2004年第一季度至今的用戶佔比數量變遷。到2020年第一季度,其AMD用戶數量佔比的確已經接近40%。但從其統計方法就很容易想見,這個數據不能代表一般的消費市場。因為一方面PassMark只針對Windows平臺,另一方面會提交測試成績的用戶大多都是技術愛好者——而AMD在技術愛好者中的用量會顯著大於普通消費用戶。所以40%這個數字大致上是不靠譜的。
不過從這張圖的歷史趨勢來看,雖然佔比數字可能無法代表市場整體狀況,但其歷史走向還是符合實際情況的。比如這張圖中在2005年前後,AMD與Intel的市場份額非常接近。實際上,AMD在2003年推出K8處理器,首度將內存控制器放到CPU內部,同時很快引入了x86-64處理器Athlon 64,實現對64位的支持——無論在這個向下兼容的決定中,AMD是否存在過錯,當時AMD都一度將自家的PC處理器產品推向了高峰。而且在此期間,著名的Intel Pentium 4正在背負高頻低效的罵名。2004年下半年起的一段時間內,AMD出現了與Intel在PC處理器市場份額上相持不下的局面。
但好景並不長,收購ATI成為AMD走下坡的轉折點。有關收購導致的問題在此不多做贅述,但AMD 2006-2008三個財年的營業利潤(Operating Income)都處在虧損狀態,其中2007年的營業利潤為-27.10億美元。2009年,AMD就出售了旗下的晶圓製造廠(即現在的Global Foundries),以及移動圖形晶片業務(也就是現在高通的Adreno)。
2011年AMD為PC處理器做出了現在看來完全錯誤的技術決策:CMT(Clustered MultiThreading),並在後續的處理器產品上,單核性能拉開了與Intel越來越大的差距,直至幾乎完全放棄高端市場,以及被嘲笑「i3秒全家」。實際上,2012、2014、2015、2016年AMD的營業利潤都全部以負數狀態出現在財報中,其中2012年、2015年,AMD的年度收益(Revenue)也出現大幅滑坡,分別下跌17%和28%[5]。我們沒有仔細去研究這些年AMD財務出現問題的具體原因,但可以肯定的是,這十幾年,AMD的日子都不大好過。這些在PassMark的市場份額走勢中也相當明確地展現出來了。
不過在PassMark的數據裡,2017年似乎成為又一個轉折點,並在2019年有一波強勢反彈。2017年正是AMD宣布推出Zen架構的一年,而去年則有Ryzen 3000系列發布。
我們雖然撰文仔細解釋過Zen 2架構相較上代架構的改進[6],但實際上,Zen初代架構的發布對AMD來說才真正有著裡程碑式的意義。也是從Zen初代開始,AMD的PC處理器終於在單核性能上趕上Intel,彌合了多年來的產品競爭鴻溝。針對這一點,我們首先來談一談在Zen以前,AMD選擇CMT技術路線之後,其處理器走的是怎樣一條路。
在過去十幾年裡,AMD都在採用一種名為推土機(Bulldozer)的處理器微架構。這裡我們不談AMD在CPU工藝方面的落後問題,畢竟Intel保持了十多年的製造工藝絕對領先:2017年Zen發布之際,AMD更早的APU主流產品線還在用28nm工藝,這個時候Intel的Kaby Lake處理器產品已經在用14nm工藝。更重要的是,推土機架構一直以來的重點在於:將整數scheduler和吞吐能力翻番,整數單元模塊能夠同時接收兩個指令的線程——這樣一來對於整數運算負荷比較重的工作,會有優勢。
但每兩個整數單元共享一個浮點運算單元。推土機更適合用模塊(module)來劃分,而非傳統的核心(core)。兩個物理整數核心,以及一個浮點核心構成一個模塊[7]。在「核心」這個概念上,AMD也在宣傳中將1個模塊算作2個核心。這種CMT的微架構理念,意即:處理器的某些部分,是給兩個線程共享的;而某些部分則是每個線程獨佔的。
推土機架構一個完整的模塊,也就是2個核心,來源:Wikipedia[7]
這種思路與Intel選擇的SMT(Simutaneous MultiThreading)就有顯著不同,在Intel的超線程技術中,兩個虛擬的並發線程,共享一個物理核心的資源。
說得再具體一點,一個推土機CMT模塊,針對整數運算來說就是兩個核心,但對浮點運算來說有時是一個核心、有時又可以算作兩個核心——這主要取決於執行的兩條線程中,浮點指令是否填滿了CMT模塊中的浮點單元,以及浮點運算單元正在執行的是128bit還是256bit浮點操作。因為在模塊中,每兩個整數核心,只搭配了一個浮點單元——這個浮點單元又包含兩個128bit FMAC(浮點乘法累加)執行單元。
之所以選擇這種方案,按照AMD所說是因為他們認為,當時的絕大部分作業系統工作,都是基於整數運算的,比如說循環迭代、真假布爾值比較或者預測。CMT所要達成的理念是:更加充分、高效地利用執行單元。然而在實際發展中,作業系統日常負載對浮點運算能力開始提出更高的要求,傳統的作業系統在分派任務的時候也面臨效率問題。且在僅有一個線程的情況下,CMT模塊就面臨大量整數運算單元空閒的問題。CMT這種方案最早在Sun公司推出之初,就定位於偏弱的單核性能,以及藉由堆核心的方式來達成高性能,實際證明並不適用於PC市場。比較有趣的是,由於CMT這種設計方案的特殊性,當時甚至有消費用戶將AMD告上法庭,稱AMD宣傳的核心數目存在欺詐問題。[8]
此外,推土機還有一些設計理念也始終被人詬病。比如說直寫式(write-through)的L1 cache,以及一個模塊共享的L2 cache,都導致了更高的延遲和功耗。另外推土機沒有採用μop cache,也增加了指令解碼功耗與延遲。加上製造工藝方面的缺陷,AMD在高端市場上沒有能力與Intel一戰也顯得理所應當。
推土機的最後一代產品挖掘機(Excavator,第四代推土機)在規劃中,已經針對原版的推土機設計做了很大的改進,包括晶片設計上金屬堆疊、新的線程/dispatch機制,新的內部分析技術實現更低的功耗、更高的性能;更大的L1-D cache,L1 BTB(Branch Target Buffers)等。在2016年AMD公布的一張產品規劃圖中,採用新核心(挖掘機這代微架構的核心名為Carrizo)的APU,預計到2020年能效(energy efficiency)相較2014年可以提升25倍[9]。
不過我們都知道,2017年Zen就問世了,推土機退出歷史舞臺。只是Zen的誕生也並不是一蹴而就的。一般我們認為,2012年Jim Keller回歸AMD是Zen得以誕生的主要推力[10]。Jim Keller當時的目標就是要構建一支隊伍,為新架構奠定基礎。Jim Keller在AMD花了三年時間構建起Zen,之後又去了Tesla。
隨後AMD又花了一年時間對Zen做精調,Zen便以Ryzen(銳龍)處理器的名號於2017年問世了。Zen架構的目標就是構建起屬於高端CPU應有的性能,或者說要像Intel那樣獲得足夠好的單核性能,所以放棄CMT是一定的。鑑於篇幅關係,本文不打算花太多筆墨去談Zen初代架構是什麼樣,更多內容可以參見我們早前對Zen 2二代架構的解析[6]。
最初AMD提到,Zen相較挖掘機核心的IPC性能提升40%
Zen架構從各種角度,都更像是當代的高性能處理器了,或者說這才是高性能處理器應有的樣子。相較推土機,Zen的改進主要在於第一加入了μop cache,這樣一來最近用過的指令就能放進μop隊列,而不需要進行再次解碼,一定程度節省了核心與cache之間的開銷;L1、L2、L3三個層級的cache改進,包括cache帶寬、容量的顯著增加;以及真正轉向SMT,一個物理核心能跑兩個線程,第二條線程也能訪問執行埠、隊列、cache。
在實現方式上,AMD的SMT和Intel的超線程還是有區別的,比如說Zen採用兩個scheduler,一個給INT整數,一個給FP浮點。更多的變化當然不止這些,比如在功耗問題上,Zen針對圍繞核心的關鍵路徑做更為激進的監控,在各個區域控制好頻率和功率(Zen有更多的不同時鐘區域);還有加強的分支預測器,更大的scheduler、dispatch、retire,加強的load/store單元等等。
Ryzen處理器還有一點十分重要的改進,即初代開始採用GlobalFoundries的14nm FinFET工藝;而且在Ryzen 3000(Zen 2)產品上針對桌面端CPU採用臺積電的7nm工藝。由於Intel的10nm工藝遲遲未能進入量產階段,且應用於Ice Lake-U十代酷睿移動版的10nm工藝顯然也還不夠成熟:市場上已經部署的Ice Lake處理器頻率未能抬升到與14nm Comet Lake同等高度,即表明Intel仍需要時間對10nm工藝做調優。考慮到Intel的10nm工藝,與臺積電的7nm工藝基本可認為是同代工藝,那麼AMD多年的CPU製造工藝落後問題也幾近解決。
在Zen架構問世最初,AMD宣稱相較最出色的推土機產品,其IPC提升超過40%,且功耗不變——在產品問世之際,當時就有不少技術愛好者和分析師質疑AMD是否真能達成自己所說的成績。而在正式發布會上,AMD又改了這個數字,提及依據SPEC的基準測試成績來看,新一代產品相比打樁機核心(Piledriver)性能提升52%,相比挖掘機(Excavator)提升64%。
與此同時,AMD還提到了每瓦性能2.7倍的提升,而為效率提升做出貢獻的主要包括了上圖中提到的這些因素。
單線程性能對比,藍點表示Intel Core產品,紅點表示AMD產品,未標註文字的藍點應該是不同頻率下Intel Kaby Lake處理器的成績,來源:AnandTech[11]
多線程性能對比,來源:AnandTech
AMD在Ryzen初代(Zen初代)剛發布之後,從AnandTech的測試結果來看,Ryzen初代處理器最重要的變化就在單線程性能表現上,AMD終於達到了與Intel同代旗艦PC處理器產品相似的水平,這也是AMD這些年在Zen身上努力的方向,包括全新的預取(pre-fetch)算法,μop cache的引入,明顯更大的L2 cache等等。單核性能以往從來都是Intel的傳統優勢項目,Intel也在包括微架構、製造工藝等諸多層面為保持這種優勢地位做了不小的努力。
Ryzen初代產品的多線程測試則表現出了十分顯眼的競爭力,尤其在綜合考量產品售價(橫軸,此時尚未考慮到Intel產品的後續降價)與性能表現時。這樣的性能表現在以往可是從未有過的。值得注意的是,上面這兩張圖中的A10-7890K乃是此前AMD推土機APU產品(Kaveri)中性能之冠,Ryzen 7 1700較之已經有了性能方面極大的提升。
總體產品性能與價格對比,來源:AnandTech
次年,AMD發布改良版Zen架構:Zen+,以及採用Zen+的Ryzen 2000系列產品;2019年的CES展會上,Zen 2架構宣布推出,且這一年Ryzen 3000系列產品開始採用臺積電的7nm工藝(Ryzen移動平臺產品例外)。如果說初代Zen發布,還算是將性能達成可與Intel媲美的程度,那麼其後的步伐就大有在性能上趕超Intel的意思了。
尤其就日常任務來看,當AMD的處理器開始在單核性能表現上與Intel越來越齊頭並進時,Intel的產品策略也做了相當激進的調整,這是過往十幾年都不曾出現過的局面。例如Intel一舉將第八代Core低壓處理器的核心數量翻倍——被用戶戲稱為「一屁股坐在了牙膏管上」,且架構都還沒來得及做大幅調整(Kaby Lake Refresh)就開始做產品部署;另外就是產品的降價策略越來越激進,尤其在Ryzen第三代線程撕裂者(Threadripper)CPU正式發布以後,Intel很快就對高端產品線Cascade Lake-X架構Core i9相應產品做了價格調整,最高降幅達到50%。
從現有雙方桌面級PC處理器的高端產品對決來看,去年年末同期上市的AMD Ryzen 7 3950X(16核/32線程/4.5GHz睿頻/TDP 280W/TSMC 7nm/749美元)與Intel Core i9-10980XE(18核/36線程/4.6GHz睿頻/TDP 165W/14nm/999.99美元),同平臺下,後者已經開始在應付某些CPU絕對性能跑分測試(如Cinebench R15/R20)時相較前者越來越吃力。
當然在Intel堅守的類似於SPECworkstation這樣的生產力測試項,以及遊戲項目測試中仍然保有優勢;另外在第十代Core產品中,Intel加入了一些新的特性,包括AVX-512原生支持,以及Intel Deep Learning Boost,對AI做加速(其中包含有AVX-512矢量神經網絡指令支持)。只不過現有消費級桌面用戶市場還鮮有應用場景,而且這些新特性大概暫時不能反映到系統性能跑分成績上來——這對Intel而言或許也不算公平。
但無論如何,Intel在PC處理器領域性能方面的絕對領先優勢的確已經不再。
有關PC處理器市場方面更為抽象的變化,如前文所述,將在3月刊的《國際電子商情》雜誌中刊發。而在本文,我們談到了一些更偏向技術層面,以及更具體的市場行為,包括Intel開始更為積極地參與到堆核心的競爭中來,且在近兩年持續多次對產品價格做出調整,甚至越來越注重召開產品發布會的時機。這些都是對AMD產品愈發具備競爭力的回應。
Intel在PC處理器市場的基本盤更在於PC OEM廠商:去年微軟首次在Surface產品線上引入了AMD Ryzen版本的Surface Laptop 3筆記本,而且價格相較Intel Core版更便宜。這原本是比對同一款消費電子產品,相同外殼、尺寸甚至是散熱設計的前提下,Intel與AMD競品的大好機會。不過可惜的是,在移動產品線上,Intel與AMD的產品更多表現出了錯位競爭的方式。
就兩個版本的Surface Laptop 3在性能、續航及效率上的對比結果來看,Intel Core版仍然是碾壓AMD Ryzen版的[12]。不過微軟為這款筆記本選配的Intel處理器是最新的Ice Lake-U產品,即第十代Core低壓處理器中,採用新工藝(10nm)和新架構的產品;而AMD Ryzen版,雖說也是最新的Ryzen 3000系列,但移動版的Ryzen 3000並沒有採用最新的Zen 2架構,也沒有採用7nm工藝。這種錯位競爭實則產生了明確的代差。
無論如何,PC OEM廠商開始在同型號產品中採用AMD、Intel兩個版本的處理器乃至兩個平臺,都表現出AMD的市場競爭力正在加強,且延續多年的市場頹勢也在發生變化。微軟也並非唯一一個正在這麼做的OEM廠商。AMD競爭力的加強,從其近兩年的財報就能看出十分顯著的變化,不僅是年度收益持續上揚,FY2019 Q4營業利潤增幅達到了213%。
上個月的CES 2020展會上,AMD宣布推出Ryzen 4000系列移動處理器,相較Ryzen 3000系列移動處理器,這次的產品也開始和Ryzen桌面版一樣採用臺積電7nm工藝,Zen 2架構核心,TDP設計15-45W不等。移動版Ryzen 3000系列還在用一代改良版的Zen+架構,以及Global Foundries的12nm工藝。另外這次的Ryzen 4000移動版核心數目至多推高到了8個[13],前文提到的Ryzen 7 4700U/4800U即在其列,8核低壓處理器對超級本市場來說又是一劑強心針。
除CPU部分之外,其餘部分的提升還包括:
AMD宣稱TDP 15W的CPU每瓦性能能夠提升2倍,所以核心數量翻倍,且頻率不變,但功耗保持一致。APU整體的同頻功耗降低20%。可能比較令Intel感到恐怖的是,AMD宣稱,Ryzen 4000移動版處理器預計會在今年一季度上市。這大概足夠給Intel再次造成壓力了,因為從Intel的計劃表來看,Ice Lake之後的下一代產品(Tiger Lake,以及Intel的10nm真正成熟)預計今年年末才會問世。
而本次發布也造就了文首提到的Ryzen 7 4800U低壓處理器達到標壓處理器跑分成績的局面,即便對於這裡的跑分環境我們仍然抱持懷疑態度。但很顯然,今年的PC,尤其筆記本市場又將掀起一波性能攀升的小高潮,這在摩爾定律持續減緩的當下實在是罕見——技術的良性競爭就是可以為消費用戶帶來這樣的遍歷。
除此之外,預計到今年第三季度Zen 3架構就要登場了,Ryzen 4000桌面版處理器也將到來。這是Intel又需要花時間精力正面迎擊的戰局,Intel在過去十幾年裡似乎從未如此被動過。
去年11月份德國最大零售商Mindfactory.de的CPU總銷量中,有82%是屬於AMD的,最暢銷的產品為Ryzen R7 3700X/3600X。在Mindfactory.de的歷史上,2018年以前都沒有AMD超過Intel的情況發生。同樣是這個月,亞馬遜最暢銷處理器Top 10榜單,AMD佔了8個席位,其中排名第一的是Ryzen 2700X。雖然如前文所述,CPU的消費市場出售渠道並不能說明太大的問題,Intel都必須重視如今這一局面了。
不過最後還是需要提及,就我們觀察近些年Intel的財報狀況,單從年度收益、淨利潤和現金流的角度來看,AMD這家公司的規模始終與Intel不在一個量級上;AMD歷年的年度營收都不到Intel的1/10。而且Intel的盈利來源也遠不止CPU市場。但對Intel而言,PC處理器所在的CCG(客戶運算事業群)業務仍然佔到其年度總應收的約52%,雖然我們不清楚PC處理器在其中具體佔比是多少。
且Intel近些年的財務狀況始終十分健康。在財力雄厚,以及早年有著教科書級別的市場行為做助力的前提下,Intel要找回市場,並且重新擁有技術方面的領先優勢或許也並不算難事。只是此刻,Intel已經需要在意市場狀況的變化、對手動向,以及找到最快的應對之策了。
參考來源:
[1] HP EliteBook 845 G7 Notebook PC Performance Results - UserBenchMark
(https://www.userbenchmark.com/UserRun/23316225)
[2] Intel Core i7-10710U - UserBenchMark
(https://cpu.userbenchmark.com/SpeedTest/900004/IntelR-CoreTM-i7-10710U-CPU)
[3] 聊聊無風扇的Surface Pro:性能比一般筆記本差多少? - 麵包板
(https://mbb.eet-china.com/blog/3893689-413612.html)
[4] AMD vs Intel Market Share - PassMark
(https://www.cpubenchmark.net/market_share.html)
[5] AMD Financial Statements 2005-2019 - MacroTrends
(https://www.macrotrends.net/stocks/charts/AMD/amd/financial-statements)
[6] 13年了,Zen 2架構終於讓AMD達到Intel的高度?- EE Times China
(https://www.eet-china.com/news/201907191446.html)
[7] Bulldozer (microarchitecture) - Wikipedia
(https://en.wikipedia.org/wiki/Bulldozer_(microarchitecture)#CMT)
[8] 博弈的藝術 AMD RYZEN 7銳龍處理器深度測試 - EVOLIFE.CN
(https://www.evolife.cn/computer/54351.html/2)
[9] AMD Carrizo Part 2: A Generational Deep Dive into the Athlon X4 845 at $70 - AnandTech
(https://www.anandtech.com/show/10436/amd-carrizo-tested-generational-deep-dive-athlon-x4-845)
[10] Jim Keller (engineer) - Wikipedia
(https://en.wikipedia.org/wiki/Jim_Keller_(engineer))
[11] The AMD Zen and Ryzen 7 Review: A Deep Dive on 1800X, 1700X and 1700 - AnandTech
(https://www.anandtech.com/show/11170/the-amd-zen-and-ryzen-7-review-a-deep-dive-on-1800x-1700x-and-1700/23)
[12] The Microsoft Surface Laptop 3 Showdown: AMD's Ryzen Picasso vs. Intel's Ice Lake
(https://www.anandtech.com/show/15213/the-microsoft-surface-laptop-3-showdown-amd-picasso-vs-intel-ice-lake)
[13]AMD Ryzen 4000 Mobile APUs: 7nm, 8-core on both 15W and 45W, Coming Q1
(https://www.anandtech.com/show/15324/amd-ryzen-4000-mobile-apus-7nm-8core-on-both-15w-and-45w-coming-q1)
責編:Luffy Liu