從歷史脈絡理解AMD為何要雙軌化GPU發展路線

2021-01-13 騰訊網

最近AMD在2020年財務分析師大會,宣布讓人極度訝異但也不會太意外的「雙軌化GPU發展路線」:在GPU「泛用化」基礎上,「遊戲優化的RDNA」和「運算導向的CDNA」分道揚鑣,「體內DNA不同的」兄弟登山,各自努力。老對手nVidia這幾年來也是分開專業與遊戲GPU,但也沒有誇張到「讓上一代架構繼續枝繁葉茂」。

更諷刺的是,CDNA並非「全新GPU架構」,而是回頭繼續發展第四時代的「南方群島系列」CGN繪圖核心,這重大決定象徵2006年7月購併ATI的AMD,融合CPU與GPU的「Fusion」與昔日GPGPU大戰略的野心終結,以及AMD對市場局勢的致命誤判。

當「運算」和「遊戲」分而治之:GCN的Vega與RDNA的Navi

套用現在市面產品,RDNA和CDNA說穿了,分別是AMD現行同為臺積電7納米製程的「Vega」(織女星)和「Navi」(仙后座),分屬第四時代的GCN(Graphic Core Next)與第五時代的RDNA(Radeon DNA)。GCN從2012年到2019年,製程橫跨28納米、14納米、12納米到7納米,演進5個版本,唯一共同點只有從未實質威脅到nVidia的GPU霸業。

這兩者的設計理念也大相逕庭,GCN是「追求GPGPU的泛用理想」而「Easy To Program For Performance」,「讓ATI Radeon的遊戲基因再度偉大」的RDNA則是「Easier Achieved Performance」,一個讓你寫程序做自己想做的事情,另一個讓你玩遊戲不需擔憂性能不足,差異不言可喻。很久以前就不乏「GCN為運算而生,不太像為了遊戲的架構」的說法。

7納米Vega的弦外之音

2019年2月發布臺積電7納米製程「Vega 20」核心的Radeon VII,距離預定的全新Navi不到半年,外界第一時間會聯想到的可能性,大致如下:

但Vega 20相較三星14納米製程的前代,有了飛躍性改進:

順便一提,Navi跑OpenCL不但沒Vega快,連Navi核心的RX5700XT還跑輸GCN4時代Polaris(北極星)核心的RX590。這些都是Vega即將「轉換」純運算應用的強烈信號。

至於先前隨著MacOS測試版大量洩露的AMD GPU代號與近來流竄坊間的謠言,也間接透露AMD的「雙軌共構大計」。

「全新CDNA」的「Arcturus」(大角星):臺積電7納米+(EUV)製程,晶粒面積應該會大的恐怖,實際上的第六代GCN架構,核心規模高達128組CU單元,SP單元更會多達8,192個,32GB HBM2E內存,最大理論運算能力約為26TFlops(FP32)與105TOPs(INT8)。Infinity Fabric的多GPU延展性,將是反攻超級計算機市場的關鍵武器,但能否像nVidia具備人工智慧需要張量(Tensor)運算單元,就不得而知了。

同場加映「好相好」nVidia下一代「Ampere」的旗艦晶片GA100的謠傳規格:臺積電7納米+(EUV)製程,晶粒面積是驚世駭俗的826mm ,核心規模高達128組SM單元,SP(CUDA Core)單元8,192個,前代2倍數量的張量運算核心(Tensor Core),48GB HBM2E內存,最大理論運算能力約32TFlops(FP32)。

先不論AMD「兩顆打一顆」的策略是否有奏效,但唯一可確定的是,AMD已用實際行動,承認投資多年的GCN無力兼顧遊戲市場,也沒顧好原先鎖定的應用,這些問題的種子,早在AMD購併ATI時就已種下,還綻放出如紅火鮮豔的災難之花。

AMD對Fusion的怨念註定一連串亂局

2006年耗費54億美元購併繪圖晶片巨頭ATI的AMD,不但仿照擁有低功耗小核心Atom的Intel,同時研發兩種應用截然不同的x86 CPU核心,並很快就以融合CPU與GPU的「Fusion」為未來戰略主軸,APU(Accelerated Processing Unit)則是成果──雖然一開始就出師不利。

AMD公開Fusion大戰略時,剛好是英特爾對AMD發動帝國大反擊的關鍵時刻,或多或少讓人感覺到AMD大事不妙,但因仰仗K8的豐功偉業而讓AMD的CPU「餘威猶存」,nVidia沒有x86 CPU,Intel繪圖核心的性能和技術有多糟糕就更著毋庸議,所以當時外界普遍看好AMD結合自家CPU與ATI GPU的高性能單晶片解決方案,更吸引了眾多投資者目光。

隱藏在Fusion戰略背後的是AMD更巨大的野心:讓走上泛用化之路的GPU,成為AMD無法被撼動的絕對優勢。試想一個場景:假若GPU足以在現實生活的應用,完全取代現有CPU的浮點運算,甚至某部分整數運算,又和CPU融合為一,這天大的好事一旦發生在2010年初期的AMD,那英特爾和nVidia真的都要閃一邊去了;也因此AMD拼命鼓吹「異質運算」(Heterogeneous Computing),吹得很大很用力,企圖創造「CPU與GPU共同的勝利」。

這也是AMD在後K8時期的x86處理器架構轉向集群多線程(CMT,Cluster-Based Multi-Threading)的深層緣由,兩個簡單的整數運算核心共享一個「模塊化」浮點運算單元,一方面拼帳面核心數量,另一方面假以時日將浮點運算器「狸貓換太子」成萬事皆備的GPU,Fusion大戰略就此功德圓滿,雞犬升天。

從享有中間位置的地利之便變成兩頭皆空

AMD 2020年財務分析師大會再度扶正的GCN,是在這個時代背景下誕生的產物。

2009年底到2010年初,正是喊了很久的GPU泛用化侵入CPU領域的第一步:支持IEEE 754浮點數規範。但舊有ATI體系的第三代TeraScale,超長指令集(VLIW)架構的程序真的比較難寫,已證明無力在GPGPU抗衡「引領nVidia GPU更大幅接近主流泛用CPU的Fermi」,源自純正AMD血統、多線程SIMD化的GCN自然是理所當然的救世主,然後2012年初登場就被nVidia的Kepler華麗打爆,從該蹶不振。

備多力分的AMD也開始在執行面諸事不順,集群多線程的推土機(Bulldozer)核心一再延誤,讓初代APU「Llano」只能沿用老舊的K10核心,而集成的GPU也是性能不太夠力的舊時代TeraScale 2,導致倍受期待的Llano淪為市場定位不上不下、高不成低不就的尷尬產品,不僅讓AMD在2012年第二季營收下滑、股價下跌,第三季被迫打消價值高達1億美元的Llano庫存呆帳,演變成不甘利益受損的投資者群起控告AMD,最後AMD花了2,950萬美元補償投資者損失的悲慘結局。

後面接連數年的劇情就如各位所見,無論CPU還是GPU,AMD就被英特爾和nVidia一路狂扁到2018年,像德國一樣在歐陸享有「中央位置」地利之便的AMD,反而弄巧成拙遭兩面夾殺。

更重要的是,GPGPU的軟體生態系統統遲遲沒有增長到AMD十多年前樂觀預期的水準,加上英特爾積極擴張SIMD指令集(最具代表性的是2011年Sandy Bridge的AVX)穩定提升x86 CPU的浮點性能,「GPU越俎代庖,替換CPU的浮點運算器或大部分功能」根本毫無美夢成真的條件,當下保證網絡瀏覽器能有效藉由GPU加速就不錯了。

這年頭「會做很多事情,有多重專業」的「斜槓」是非常流行的「激勵鬥志的心靈術語」,但不是每個人都有本事畫出那條斜線,角度一沒抓好,就變成「刪除線」了。

內存帶寬仍是GPGPU性能的瓶頸,尤其是AMD

相信不少人一看到AMD的雙軌化GPU路線,馬上想到的第一個主因是「兩邊用的內存不一樣,一邊HBM、一邊GDDR,nVidia目前計算用主力產品Volta也是HBM,人工智慧推論仍是GDDR6的Turing」。

在GPGPU進入平常百姓家的漫漫長路,「每個運算可分配到的內存帶寬穩定下滑」一直是看不見的痛,高性能浮點運算和人工智慧也同,要提高性能,絕非增加幾個矩陣計算和人工智慧特化導向指令那麼簡單,帶寬不足就發揮不出性能。相對於增加指令多佔用的執行單元布局空間,運算可用帶寬的配套措施,會更讓GPU廠商感到頭痛。

高性能浮點運算或深度學習專用的GPU勢必搭配HBM內存這件事,Google自家TPU就是最好例證。如果用不起昂貴的HBM,只能亡羊補牢,從GPU內部的緩存內存架構壓榨出一絲一毫帶寬。AMD在Navi的緩存內存大興土木,原因就在此,過去所有歷代GPU,這部分更是不可或缺的重頭戲。

不過一說到內存帶寬這檔事,不禁讓人回憶起nVidia早從2004年NV40時代,內存控制器就內置壓縮傳輸功能,相關技術持續推陳出新,並據聞都已申請專利。以往十幾年,AMD的GPU要達到相同性能水準所需的內存帶寬,都比nVidia高出許多,這難道就是「這些年來,我們一起納悶不已的怪現象」之完美解答嗎?絕對不是,應該不是,也許不是,希望不是。

看不見的商業現實:內存「期貨」的潛在利潤

優秀技術不見得見容於商業的現實,顯卡用的內存當然也是。

AMD早在2015年就在第三代GCN的Fiji(Radeon R9 Fury X)率先在GPU導入HBM,後來也在第五代GCN的Vega放了HBM2,看在內存饑荒方興未艾的份上,應可合理預期越來越多GPU與HBM「送作堆」。但這些年來也未見HBM比較普及,連nVidia也將HBM限定在高端計算用產品,除了成本和產能考量,「擋人財路」恐怕也是主要因素。

這年頭價格起起伏伏的內存早就成為某種形式的「期貨」,內存的漲跌價差也是顯卡廠商可通過採購策略取得的獲利來源,當GPU直接包內存,就等於斬斷這條賺錢渠道,產品也難以做出差異化。換言之,唯有包裝成高單價利基產品的運算卡,保留更多利潤給客戶,才能有幸一親芳澤,AMD硬推HBM繪圖產品就顯得相當一廂情願,或可視為對市場生態的錯誤判斷。

總之,假如連CPU也沒機會雨露均沾,看來將有很長一段時間看不到HBM出現在一般個人計算機內部,也沒可能看到「像Radeon R9 Nano或Vega 56 Nano這種可塞入Mini-ITX專用機箱的超小型旗艦級顯卡」,真是可喜可賀。

雙軌放兩邊,應用擺中間,Fluid Motion就這樣死透了嗎?

總之,AMD想搞多少條軌道建設,外人無從置喙,但倒是有兩件事值得大家多多關注:

(首圖來源:AMD)

相關焦點

  • 中國民俗文字發展脈絡
    中國民俗文字發展脈絡中國文字說(四)中國文字的發展,從歷史上就有三條發展脈絡。前面我們已經論述了二條:中國方塊漢字的發展脈絡和中國少數民族文字的發展脈絡,此篇文章,我們就來論述中國文字的第三條發展脈絡,這就是:中國民俗文字的發展脈絡。什麼是「中國民俗文字」?
  • 中國少數民族文字發展脈絡
    中國少數民族文字發展脈絡中國文字說(三)中國有55個少數民族中,也就是說,除了漢族以外,其他都屬於少數民族。目前,有29個民族有與自己的語言相一致的文字,是中國文字史的重要部分由於,有的民族使用一種以上的文字,如傣語使用4種文字,景頗族使用2種文字,所以29個民族共使用54種文字。
  • 一分鐘,看透我國古代錢幣發展脈絡
    我國鑄造錢幣的歷史非常悠久,可以追述到商周時期,數千年的時間裡留下了數以萬計的錢幣種類,讓一些剛入局的泉友望而生畏,有沒有一種方式能快速理清歷朝歷代的錢幣發展脈絡呢?以下內容是文瀚樂拍依據個人理解歸納的結果,只針對銅錢,僅供參考。
  • 歷史學習小竅門:熟練幹支紀年轉換 把握歷史脈絡
    如果給你出道歷史題,比如,日本明治維新的時候中國在幹什麼?你是不是第一要考慮的就是,那是什麼時間發生的事? 要想把歷史學透,融會貫通,根據時間脈絡進行橫向比較,是重要的方法之一。 比如,和大漢王朝同時代的西方大國是哪個國家?
  • 如何理解歷史人物智慧,需要掌握這三種辦法!
    從這個角度,十三阿哥最懂雍正,歷史人物和歷史人物之間的關係也相當複雜,但是歷史人物之間彼此認知也是見仁見智慧的存在。快速了解歷史人物的三個方法:第一、換位思考。把自己角色替換到具體歷史人物所處的環境,思考事物變化,以及當事人的選擇和決定,才能理解具體行為背後的戰略和戰術安排。
  • 山西旅遊業為何發展不起來 經濟發展為何裹足不前
    山西旅遊業為何發展不起來 經濟發展為很多省份也慢慢地在不斷完善並開發新的景點,試圖打造旅遊城市,著眼於長遠規劃,增加國民經濟的收入。做得比較好的有長沙、成都、廈門、西藏等。說起山西印象最深刻的就是「煤炭」。
  • 把美國歷史放在全球史背景下,才能充分完整地理解它
    這似乎是理所當然的事,畢竟沒有哪個國家的歷史發展是真正與世隔絕的——如果真有這樣的國家,恐怕它也「發展」不起來;況且,如果連中國這樣較遲「與世界接軌」的國家都是如此,那麼像美國這樣從殖民地時期就深受外部影響的國家,似乎就更應予以重視了,畢竟乍看起來它根本就沒有「美國的美國」這個階段,而從一開始就是「世界的美國」。
  • 可持續發展歸根結底要靠黨的可持續發展
    可持續發展歸根結底要靠黨的可持續發展   中央政治局第32次集體學習講解者張志明——  可持續發展歸根結底要靠黨的可持續發展  人物檔案  張志明,國家哲學及人文科學工程建設專家組成員,中共中央黨校教授、黨建教研部副主任,參加過十五大、十六大調研及報告起草
  • 如何理解發展的不平衡不充分
    原標題:如何理解發展的不平衡不充分 黨的十九大報告指出,「中國特色社會主義進入新時代,我國社會主要矛盾已經轉化為人民日益增長的美好生活需要和不平衡不充分的發展之間的矛盾」。我國社會主要矛盾的轉化標誌著中國特色社會主義發展進入了新階段。
  • 從群眾中來 到群眾中去——95年來黨的群眾路線的形成和發展
    黨所取得的這些成就,離不開群眾路線。群眾路線是中國共產黨根據辯證唯物主義和歷史唯物主義的原理,在長期的革命和建設實踐中創立和不斷發展的;是馬克思主義在中國的傳播和中國化的進程中,中國共產黨對馬克思主義關於人民群眾是社會主體和歷史創造者的理論做出的創新和重大發展。在當前全黨開展全面從嚴治黨推進黨的建設新階段,全面把握黨的群眾路線的提出、形成和發展的進程,從中得出有益的認識,具有十分重要的意義和作用。
  • 「九二共識」成本土藍分離路線護身符?
    這是國民黨相當罕見的一次路線大衝洗,接下來,洪秀柱一年多黨主席任內所走過的痕跡、去年通過的「和平政綱」會不會被推翻受到矚目。而吳敦義接下來的任務,除了2018地方選舉,還包括能否鞏固國共平臺?維繫國共關係?這也是中國國民黨的新挑戰。   2016年3月底洪秀柱上任後這一年多是國民赴來臺後,黨內首度的兩岸路線大鬥爭。
  • DragonFlyBSD 從 FreeBSD 引入 AMD 溫度驅動程序
    從 FreeBSD 引入的部分驅動中,amdtemp 驅動尤其值得關注。此驅動支持對 AMD 0Fh, 10h, 11h, 12h, 14h, 15h, 16h, 和 17h 系列處理器的溫度進行監控。其中對 AMD Family 17h 的支持涵蓋了 Zen 1 以及 Zen 2,包括 Threadripper 和 EPYC 等。
  • 楊廣為何要修大運河,只是為了享受嗎?把路線連起來,你就明白了
    我們知道,封建時代的中國,有修史的習慣,從《史記》之後,基本都是斷代史,由新建立的王朝去修編前朝的歷史。這樣一來就會出現一個十分矛盾的現象,舊王朝大多是被新王朝消滅的,統治者對於前朝的末代皇帝自然是不會說什麼好話,所以有人認為,隋煬帝是在史書中被唐朝史官給故意抹黑了。隋煬帝楊廣,出生於公元569年,是隋朝的第二代皇帝,也是最後一位皇帝。史書記載他昏庸無道,最終導致了隋朝的滅亡。
  • 日本明治維新發展緩慢,為何甲午戰爭後開始飛速發展呢?
    【歷史】從世界歷史來看,對於日本近代的崛起,很多人都會想到日本的明治維新,認為是明治維新讓日本強大。但是其實並不是如此,日本明治維新後其實國內發展非常緩慢,而且缺錢到了極點,真正的快速發展,或者說大踏步發展,其實是從甲午戰爭後開始的。為此很多人不明白,這到底是為何呢?其實根本原因只有四個字。
  • 歐陽明高:新能源技術要多路線均衡發展
    在主動安全方面,歐陽明高認為,主動安全要靠控制,靠電池管理系統,靠軟體,把使用邊界控制好,不要出現不允許、超出邊界的情況發生等。針對現階段存在的問題,歐陽明高指出,「主動安全的控制、監控與管理是整車廠承擔的,但是整車廠對電池的理解總體上還沒有完全到位,整車廠原來不搞電池,初期大多數是由電池廠幫助做。整車廠承擔了這個責任,要有一個過程適應。」
  • 讓群眾路線這條「生命線」煥發更強生命力
    原標題:讓群眾路線這條「生命線」煥發更強生命力 學習劉少奇同志的群眾路線思想,要把相信群眾作為智慧之源 早在1937年,劉少奇同志在《關於白區的黨和群眾工作》一文中指出,「只要我們的同志尊重群眾,相信群眾,群眾才會尊重我們
  • 《人類簡史》:從動物到上帝,一部人類歷史的說明書
    人類的發展越來越快,人類能夠生產越來越多的糧食,養活越來越多的人口。人多了,溝通與協作就顯得無比重要,語言與文字的加入,讓人類的協作能力飛速增長,交流成為人類對發展產生巨大作用的催化器。而對於這種協作關係建立的描述,人類簡史書中用了一個很有趣的觀點進行描述,叫做:講述共同的故事,書中把這個故事稱為認知革命。
  • 命理派系魚龍混雜,梳理下脈絡結構,便知取捨——納音祿命序
    我們學習任何一門理論,都要對它有個一總體的認知,有個成語叫「高屋建瓴」,就是講對待任何事物要從高出著眼,總體脈絡給他理清楚,才不至於迷失其中。這一點對於學八字尤為重要,那麼多紛雜的理論,要是理不出一個頭緒來,就會越學越迷糊,學來學去自己也不知道該學誰,該相信誰。
  • 從VGA到GPU!細數二十年顯卡發展歷程
    為了輸出VGA解析度、提供VGA輸出接口,顯卡和VGA就有了不解之緣,顯卡被稱為VGA Card是有歷史原因的,如果您對此感興趣的話,請慢慢看:● 什麼是VGA?這是有歷史原因的,請接著看……● 顯卡史前資料    最早的顯卡稱為顯示適配器,在「黑底白字」的DOS年代,對顯示的要求是極低的。然而隨著各種軟體應用的普及,人們對於PC圖形界面的需求越來越強烈,為此才出現了彩色顯示。最早的顯示類型是MDA(Monochrome Display Adapter),只能區別出黑白兩色。
  • 為何甲子乙丑同為海中金,如何去理解?
    大家姑且這麼理解。不嫌鬼旺之方,喜見祿財之地:不怕官鬼,或者處於官鬼之地,喜歡見到祿、財,或者處於祿、財旺之地,祿是指乙木,財是指的納音的財,還是木(還有種解釋,祿財指的是土)。水土砥礪,忽然有氣,亦可以為器成材:有水有土,砥礪,是指相衝、相刑之類。