從蘋果A14晶片看AI算力的新摩爾定律

2021-01-09 虎嗅APP


最近蘋果在發布會上公開了新的A14 SoC。根據發布會,該SoC將用於新的iPad上,而根據行業人士的推測該SoC也將會用在新的iPhone系列中。除了常規的CPU和GPU升級之外,A14最引人注目的就是Neural Engine的算力提升。我們認為,蘋果A系列SoC在近幾年內Neural Engine的算力增長可以作為一種新的AI算力範式,成為新的摩爾定律。


A14上的新Neural Engine


蘋果公布的A14 SoC使用5nm工藝,而新的Neural Engine則使用16核心設計,其峰值算力可達11 TOPS,遠超上一代的Neural Engine。在發布會上,蘋果明確表示該Neural Engine主要支持加速矩陣相乘。此外,蘋果還表示新的Neural Engine結合CPU上的機器學習加速,可以將實際的AI應用體驗相對於前代提升十倍。



新的Neural Engine的峰值算力大大提升可以說是有些意料之外,但是又是情理之中。意料之外是因為A14的其它關鍵指標,例如CPU和GPU等相對於前一代A13的提升並不多,但是Neural Engine的性能提升則接近100%。而Neural Engine性能提升大大超過SoC其他部分是情理之中則是因為我們認為如果仔細分析SoC性能提升背後的推動力,則可以得出Neural Engine性能大幅提升是非常合理的。


一方面,從應用需求側來說,對應CPU和GPU的相關應用,例如遊戲、網頁瀏覽、視頻等在未來可預見的幾年內都沒有快速的需求增長,唯有人工智慧有這樣的需求。另一方面,CPU和GPU的性能在給定架構下的性能提升也較困難,很大一部分提升必須靠半導體工藝,而事實上半導體工藝的升級在未來幾年內可預期將會越來越慢,每代工藝升級更注重於電晶體密度以及功耗,在電晶體性能方面的提升將越來越小。而AI加速器則還有相當大的設計提升空間,相信在未來幾年仍將會有算力快速增長。


Neural Engine算力增長趨勢


我們不妨回顧一下過去幾代A系列SoC中Neural Engine的算力增長。



最早加入Neural Engine的SoC是2017年發布的A11。該SoC使用10nm工藝,搭載第一代Neural Engine峰值算力為0.6TOPS,Neural Engine的晶片面積為1.83mm2。當時Neural Engine主要針對的應用是iPhone新推出的人臉識別鎖屏FaceID以及人臉關鍵點追蹤Animoji,且Neural Engine的算力並不對第三方應用開放。


第二代Neural Engine則是在2018年的A12 SoC上。該SoC使用7nm工藝,Neural Engine面積為5.8mm2,而其峰值算力則達到了5TOPS,相比前一代的Neural Engine翻了近10倍。而根據7nm和10nm工藝的電晶體密度折算則可以估計出Neural Engine的電晶體數量大約也是增加了6-7倍,基本和算力提升接近。


第三代Neural Engine是2019年的A13,使用第二代N7工藝,其面積相比上一代減少到了4.64mm2,而算力則增加到了6TOPS。我們認為這一代的Neural Engine是上一代的小幅改良版本,並沒有做大幅升級。


最近公布的A14則搭載了最新一代的Neural Engine,使用5nm工藝,Neural Engine的具體面積尚沒有具體數字,但是其算力則是達到了11TOPS,是上一代的接近兩倍。


從上面的分析可以看出Neural Engine每次主要升級都伴隨著算力的大幅上升,第一次上升了近十倍,而第二次則上升了近兩倍。如果按照目前兩年一次主要升級的節奏,我們認為在未來數年內Neural Engine乃至於廣義的AI晶片市場都會有每兩年性能提升兩倍的規律,類似半導體的摩爾定律。我們認為,這樣的規律可以認為是AI晶片算力的新摩爾定律。


為什麼AI晶片算力增長會成為新的摩爾定律


AI晶片算力指數上升的主要驅動力還是主流應用對於AI的越來越倚重,以及AI神經網絡模型對於算力需求的快速提升。


應用側對於AI的需求正在越來越強。就拿智能設備為例,2017年蘋果A11中AI的主要應用還是面部關鍵點識別和追蹤,而到了2018年開始越來越多的應用開始使用AI,包括圖像增強、拍攝虛化效果等,在下一代智能設備中AI則更加普及,首先從人機互動來看,下一代智能設備中常見的人機互動方式手勢追蹤、眼動追蹤、語音輸入等都需要AI,這就大大增加了AI算法的運行頻率以及算力需求。


此外,下一代智能設備中有可能會用到的一系列新應用都倚重AI,包括遊戲、增強現實等應用中,都需要運行大量的AI模型例如SLAM,關鍵點識別、物體檢測和追蹤、姿勢識別和追蹤等等。


另一方面,AI對於算力的需求也在快速提升。根據HOT CHIPS 2020上的特邀演講,AI模型每年對於算力需求的提升在10倍左右,因此可以說AI模型對於硬體加速的需求非常強。



如果我們從另一個角度考慮,這其實就意味著AI加速晶片的算力提升在賦能新的場景和應用——因為總是有新的性能更高的AI模型需要更強的硬體去支持,而一旦支持了這樣的新模型則又能賦能新的應用。


從目前主流的計算機視覺相關的AI,到以BERT為代表的大規模自然語言處理算法,以及未來可能出現的將BERT和計算機視覺相結合的視覺高階語義理解等等,我們在未來幾年內尚未看到AI模型進步的停止以及可能的新應用場景的出現,相反目前的瓶頸是AI加速硬體性能跟不上。


這也就意味著,AI加速硬體才是AI模型落地的最終賦能者,這就像當年摩爾定律大躍進的PC時代,當時每一次CPU處理器的進步都意味著PC上能運行更多的應用,因此我們看到了CPU性能在當時的突飛猛進;今天這一幕又重現了,只是今天的主角換成了AI加速晶片。


AI算力增長來自何方?


分析完了AI加速晶片的需求側,我們不妨再來看看供給側——即目前的技術還能支持AI晶片多少算力提升?


首先,AI加速器晶片和傳統CPU的一個核心差異在於,CPU要處理的通用程序中往往很大一部分難以並行化,因此即使增加CPU的核心數量,其性能的增加與核心數也並非線性關係;而AI模型的計算通常較為規整,且很容易就可以做並行化處理,因此其算力提升往往與計算單元數量呈接近線性的關係。這在我們之前對比A11和A12 Neural Engine的電晶體數量和算力提升之間的關係也有類似的結論。


目前,以Neural Engine為代表的AI加速器佔晶片總面積約為5%,未來如果AI加速器的面積能和GPU有類似的面積,則AI加速器的計算單元數量也即算力至少還有4倍的提升空間。此外,如果考慮兩年兩倍的節奏並考慮未來幾年內可能會落地的3nm工藝,則我們認為AI加速器算力兩年兩倍的提升速度從這方面至少還有5-6年的空間可挖。


除了單純增加計算單元數目之外,另一個AI加速器算力重要的提升空間來自於算法和晶片的協同設計。從算法層面,目前主流的移動端模型使用的是8-bit計算精度,而在學術界已經有許多對於4-bit甚至1-bit計算的研究都取得了大幅降低計算量和參數量的同時幾乎不降低模型精度。


另外,模型的稀疏化處理也是一個重要的方向,目前許多模型經過稀疏化處理可以降低50%~70%的等效計算量而不降低精度。因此如果考慮模型和晶片和協同設計並在加速器中加入相關的支持,我們預計還能在計算單元之外額外帶來至少10倍等效算力提升。


最後,當峰值算力的潛力已經被充分挖掘之後,還有一個潛力方向是針對不同AI模型的專用化設計,也即異構設計。AI模型中,常用於機器視覺的卷積神經網絡和常用於機器翻譯/語音識別的循環卷積網絡無論是在計算方法還是內存訪問等方面都大相逕庭,因此如果能做專用化設計,則有可能在峰值算力不變的情況下,實際的計算速度仍然取得數倍的提升。


結合上面討論的一些方向,我們認為AI加速晶片的算力在未來至少還有數十倍甚至上百倍的提升空間,再結合之前討論的應用側對於算力的強烈需求,我們認為在未來數年內都會看到AI加速晶片的算力一兩年翻倍地指數上升。在這一領域,事實上中國的半導體行業有很大的機會。如前所述,AI晶片性能提升主要來自於設計的提升而非工藝提升,而中國無論是在半導體電路設計領域還是AI模型領域都並不落後,因此有機會能抓住這個機會。


相關焦點

  • 蘋果a14比a13強多少
    打開APP 蘋果a14比a13強多少 網絡整理 發表於 2020-11-19 14:47:13   蘋果a14比a13強多少   A14比a13強多少?
  • 蘋果a14處理器相當於驍龍多少
    打開APP 蘋果a14處理器相當於驍龍多少 網絡整理 發表於 2020-11-19 14:39:49   蘋果a14處理器相當於驍龍多少   蘋果的A14仿生處理器搭載臺積電5nm工藝製程,因為5nm工藝製程是目前行業內最先進的工藝,相較於A13晶片搭載的7nm(第一代DUV),基於Cortex A72核心的全新5nm晶片,能夠提供1.8倍的邏輯密度、速度增快15%,或者功耗降低30%,同樣製程的SRAM也十分優異且面積縮減。
  • 蘋果A14晶片,還能吊打競爭對手嗎?
    蘋果公司以頂級晶片組設計器而聞名,其出色的快速性能常常使其Android競爭對手感到羞恥。Apple A14 Bionic是該公司的最新晶片,為整個iPhone 12系列提供動力。這是業內第一款基於臺積電(TSMC)先進的5nm工藝構建的晶片組,其性能和功率效率方面的改進更是超出了2020年更大的7nm設計。
  • 蘋果正在量產A14X仿生晶片
    近期蘋果發布了搭載A14仿生晶片的iPad Air,隨後便有網友猜測蘋果應該會在不久後發布搭載A14X仿生晶片的iPad Pro。根據最新爆料來看,全新的A14X仿生晶片已經在近期開始大規模量產,或許這也代表著我們能夠更早地見到新款iPad Pro。
  • 蘋果A14仿生晶片有多香?目前安卓類手機晶片看了都慌
    蘋果發布的iPad Air採用了許多炫酷的新技術,包括Touch ID電源按鈕。但其「大腦」才是這款iPad功能的關鍵,它採用了新的A14仿生晶片。A14仿生晶片實際上是非常關鍵的硬體,因為新款iPhone 12智慧型手機、首款使用蘋果自主研發處理器Apple Silicon的Mac也將搭載這款晶片。那麼,A14仿生晶片有什麼特別之處?A14仿生晶片使用了臺積電新的5納米製程技術,這意味著其效率比以前的7納米處理器更高,從而在提高性能的同時降低了功耗。
  • 爆料稱蘋果A14晶片相比A13晶片CPU提升40%
    爆料稱蘋果A14晶片相比A13晶片CPU提升40%2020-08-11 14:03出處/作者:IT之家整合編輯:佚名責任編輯:lishiye1   有關蘋果 iPhone 12/A14 晶片的爆料逐漸增多,今日消息人士 Komiya 爆料稱蘋果 A14 晶片相較於 A13 晶片 CPU 性能提升了 40%,GPU 性能提升了 50%。
  • 蘋果A14的5nm工藝過後又將是什麼?或快到晶片性能極限時代!
    隨著iPhone12的到來,蘋果的最先進5nm工藝晶片為新一代iPhone系列電子產品帶來了強勁動力。那麼下代的A15,A16又將採用3nm甚至1nm工藝技術嗎?會不會因為極小尺寸的量子效應而到達物理技術極限呢?接下來我們便來討論一下這個問題。
  • 都是5nm晶片,為何麒麟9000比蘋果A14差,還不如A13
    眾所周知,目前全球也就只有2款5nm的晶片,分別是蘋果的A14,以及華為的麒麟9000。本文引用地址:http://www.eepw.com.cn/article/202010/419649.htm再考慮到都是臺積電5nm工藝,以及蘋果與華為的競爭關係,以及一款是iOS專用晶片,一款是安卓晶片,所以這兩款晶片自然要被大家拿來對比的。
  • 蘋果A14仿生晶片GPU 性能曝光:處於領先位置
    當 A14 仿生晶片跑分曝光時,人們認為與 A13 仿生相比,新晶片不會帶來明顯的性能提升。不過在與驍龍 865,驍龍 865 Plus 和 Exynos 990 等競爭對手相比,A14 依然處於舒適的領先地位,在 GPU 上的得分也更高。
  • A14仿生——蘋果的大腿
    蘋果在今天北京時間凌晨1點開始的發布會上說的這句話,狂音繞梁,比夜間盤旋在頭頂的蚊子還要持久和囂張。     「去年發布的A13仿生依然是智慧型手機中最快的晶片,不過這即將改變,我們世界級晶片團隊研發了一款全新的晶片——A14仿生,史上最快的智慧型手機晶片。」   這句話的意思很明顯,打敗我的只有我自己。
  • 蘋果並非晶片和AI公司,但它的晶片和AI真的令人驚豔
    作為一個聚焦矽谷高新技術的公眾號,我們就不為你匯總蘋果的新 iPhone 長什麼樣,有什麼新功能了,相信你逛一下官網就能知曉。但我為什麼推薦你看這篇文章:在今天朋友圈成千上萬條蘋果新品發布會相關文章裡,相信沒有多少像這篇一樣,能為你劃出出本次發布會上的真正重點。廢話不多說,正文開始。
  • 5nm製程六核心 蘋果A14仿生晶片發布
    鳳凰網科技訊 北京時間9月16日凌晨,蘋果召開2020秋季新品發布會,與往屆不同的是,由於全球新冠疫情影響,此次秋季發布會與WWDC20一致在線上舉行。發布會中推出全新iPad Air,最驚豔的是該款產品搭載了最先進5nm製程的仿生晶片A14,該晶片將118個電晶體封裝其中,甚至比桌面x86處理器還多,算是移動終端領域性能最強的晶片
  • 蘋果A14X仿生晶片基準測試成績曝光 表現比較不錯
    據外媒 AppleInsider 今日報導,蘋果 A14X Bionic 晶片似乎在 Apple Silicon Mac 發布會前進行了一次 Geekbench 5 基準測試,而這次測試的結果表現比較不錯。
  • 蘋果A14 仿生晶片 GPU 性能曝光:毫無懸念處於領先位置
    當 A14 仿生晶片跑分曝光時,人們認為與 A13 仿生相比,新晶片不會帶來明顯的性能提升。不過在與驍龍 865,驍龍 865 Plus 和 Exynos 990 等競爭對手相比,A14 依然處於舒適的領先地位,在 GPU 上的得分也更高。
  • 蘋果A14仿生晶片使用了全新的6核設計 採用5nm工藝製程
    蘋果A14仿生晶片使用了全新的6核設計 採用5nm工藝製程 來源:IT之家 • 2020-09-16 11:42:15
  • 蘋果失策?沒有iPhone12的發布會,地表最強晶片A14性能令人擔憂
    凌晨1點,蘋果公司如約召開新品發布會Apple Event,並且將一眾新鮮產品推給了苦苦等待的觀眾。Apple Watch Series 6、Apple Watch SE、iPad第八代、iPad Air 4等多款力作一一亮相。這些新產品中,最引人注目的,便是iPad Air 4。
  • A14仿生晶片:蘋果iPad Air4現身GeekBench跑分網站
    此前安兔兔官方就公布了採用A14晶片的iPhone 13,4安兔兔推測該機為iPhone 12 Pro Max。而現在一款型號iPad13,2的全新iPad設備現身GeekBench 5跑分網站。根據GeekBench 5的信息顯示,iPad13,2搭載蘋果A14處理器,主頻為2.99GHz,其單核成績為1583分,多核4198分,擁有4GB內存,該機或為即將上市的蘋果iPad Air4。而同樣搭載蘋果A14處理器的iPhone 13,4將擁有一塊解析度為2688×1242的屏幕,擁有6GB內存和128GB快閃記憶體。
  • 蘋果iPhone 12發布,A14晶片性能再次躍升,高通、三星誰能勝出?
    蘋果iPhone 12於今日正式發布了,晶片方面的亮點在於A14和5G,5G採用高通的基帶集成在A14中。A14晶片性能的提升主要在於電晶體數量增多,GPU,NPU以及DSP信號處理技術。在高端手機晶片領域,除了蘋果,僅有高通,三星了,還有被封殺的華為麒麟,那麼誰能與A14一較高下?
  • 驍龍875最重要特性曝光,這點不輸蘋果A14!|蘋果a14|...
    主要的差異就是在於晶片的性能。iPhone上搭載的晶片,在性能上是超越同時期所有對手甚至領先2年的,澎湃的性能讓iPhone能夠持久地保持流暢;而Mac電腦上的晶片遠沒有手機端的那麼「神奇」,在安迪比爾定律的蠶食之下,自然和大多數Windows平臺一樣難以經受時間的摧殘。換言之,一枚好的晶片非常重要,尤其是對安卓智慧型手機來說更加重要。
  • A14晶片跑分很強,但散熱或成iPhone 12「命門」
    在今年的WWDC全球開發者大會上,蘋果正式宣布Mac系列將改用自研ARM處理器。蘋果表示,首款搭載自研處理器的Mac產品最快於2021年亮相。與此同時,為了方便開發者們能夠有足夠的時間去進行軟體適配工作,蘋果推出了一款搭載A13晶片的Mac mini。