ARM推出下一代旗艦晶片架構,GPU提升60%,「NPU」即將上線

2021-01-09 手機鳳凰網

5月27日,ARM於臺北COMPUTEX 2019大會開幕前發布了下一代旗艦機手機晶片設計方案,其中包括全新CPU Cortex-A77、新GPU Mali-G77。這家公司還首次公開了新一代神經網絡晶片ARM ML,所有這些預計將會在2020年上市。

ARM 表示,新的晶片展示了該公司在 5G 融合、物聯網、人工智慧(AI)與自動駕駛領域的投入。

Arm IP 產品事業群總裁 Rene Haas 在發布會上。

Cortex-A77:製程不變,性能提升 20%

對 Arm 自己的 CPU 設計來說,2018 年是個不錯的年份。去年 5 月,我們看到了 Cortex-A76 的發布,以及後續的麒麟 980 和驍龍 855 晶片。從人們購買的反應就可以看出來——這代晶片令人印象深刻,而 Arm 成功實現了其在性能、效率和領域方面的所有承諾,為 2019 年的大多數旗艦手機提供了出色的晶片和設備。

今年,Arm 跟進了另一項技術,Cortex-A77——Cortex-A76 的繼任者。這一代 CPU 將是對去年主要微架構的直接進化,代表了 Arm 全新 Austin 內核系列的第二個實例。

Cortex-A77 不僅適用於手機,也可用作筆記本處理器,Arm 稱其性能已經超越 14nm 製程的英特爾酷睿 i5-7300U。

代號 Deimos

新的晶片架構 Cortex-A77 代號為 Deimos。它將 Cortex-A76 終止的地方作為起點,並遵循 Arm 的計劃軌跡,即每一代新的 Austin 系列 CPU 性能都能持續提升 20-25% 的 CAGR。

說到這裡,就有必要提一下 Cortex-A76 的性能了。

A76 對 Arm 及其授權廠商來說無疑是一款非常成功的內核。全新微架構和臺積電 7nm 製程工藝的結合,帶來了業內有史以來最大的性能和效率提升。結果就是麒麟 980 和驍龍 855 相對於各自的上一代手機晶片都有很大的性能飛躍。

雖然 A76 表現不錯,但競爭對手也沒有停滯不前。三星的 Exynos(獵戶座)處理器相比其上一代產品就有很大提升,製程是 8 納米。而真正的對手蘋果當前的 A11 和 A12 架構在性能和效率方面仍然遙遙領先,Arm 與它的差距大概是兩代微架構。

圖片來自 ChipRebel

Cortex-A77 概述

Cortex-A77 直接繼任了微架構 A76 意味著新的內核基本與先前的特性保持一致。Arm 表示,內核是為廠商設計的,他們無需太費力就可以輕鬆升級晶片 IP。

實際上,這意味著 A77 與其前身 A76 在架構上是一致的,仍然以 ARMv8.2 為 CPU 內核,並且與 DSU(DynamIQ Shared Unit)集群內部的 Cortex-A55 小 CPU 配對。

A77 的緩存大小等基本配置特性與前身也沒有太大區別:仍然是 64KB 的 L1 指令和數據緩存,以及 256 或 512KB 的 L2 緩存。有趣的是,Arm 的確為基礎設施 Neoverse N1 CPU 內核(源自 A76)設計了 1MB L2 緩存選項,但選擇保留客戶端(移動)CPU IP 的較小配置選項。

作為 A76 的進化版,不論是從微架構還是從絕對性能的角度來看,A77 的性能提升都沒有預期中那樣令人驚豔。

A77 將還是採用 7 納米製程,Arm 宣布它的峰值目標頻率與前身一樣為 3GHz。自然而然地,由於頻率不會有太大變化,這意味內核的 20% 性能提升只能歸因於 IP 的微架構變化。

為了實現 IPC(Instructions per clock) 增益,Arm 重新設計了微架構並引入了巧妙的新特性,總體上增強了 CPU IP,從而實現了更寬、更高性能的設計。

Mali-G77:全新架構,機器學習性能提升 60%

在 2019 年,全球遊戲市場產值將高達近 1500 億美元,這將是全球最大營收的市場之一。ARM 昨天推出的新一代移動端 GPU 將承載其中與日俱增的計算需求。

Mali-G77 採用了全新的 Valhall 架構,這是繼上代 Bifronst 架構發布三年之後的又一次重大升級。在性能上,與上一代的 Mali-G76 GPU 相比,Mali-G77 具有近 40% 的性能提升。同時 Mali-G77 還在關鍵的微構架上進行強化,包括引擎、texture pipes 和 load store caches,並將功耗效率以及性能密度均提升了 30%。

除此之外,Mali-G77 同時帶來 60% 的機器學習性能提升,顯著提升推理與神經網絡性能,以支持更多的人工智慧應用。新的晶片設計將為開發人員提供更大的發揮空間,為移動 APP 生態催生出更多的新形式交互體驗。

Bifrost 架構的最後一次迭代——Mali-G76,對 Arm 來說是一次重大的飛躍,其 IP 在很大程度上解決了前身的一些關鍵問題,為 Exynos 9820 和麒麟 980 晶片組帶來了相對較好的結果。

但是,Arm 在迎頭追趕並努力解決 Bifrost 問題時,其對手也沒有閒著。高通的 Adreno GPU 架構已經引領移動領域好幾年了。儘管今年的 Adreno 640 沒有帶來令人印象深刻的進步,但在性能、效率和密度方面,它仍然領先 Arm。並且,蘋果 A12 的 GPU 在性能、效率方面帶來的絕對是一個重大飛躍,即使是高通最好的 GPU 也與之相去甚遠,更不要說 Arm 的了。

Valhall GPU 的第一次迭代即是 Mali-G77,它實現了一些架構上和微架構的改進。

Arm 承諾在能效和面積密度(在 ISO 性能和製程方面)方面會有 30% 的增益,而 GPU 上機器學習推理工作負載的性能會提升 60%。

更有趣的是,Arm 表示在即將到來的 2019 年底和 2020 年,SoC 將預計比 2019 年的設備性能提升 40%。下一代 SoC 將只有微小的製程節點改進,所以這裡說的 40% 增益將主要來自 Mali-G77 GPU 在架構和微架構上的飛躍。

神經網絡處理器 ARM ML

人工智慧正在成為便攜設備中不可或缺的組成部分,拍照中的場景識別、增強現實中的物體識別都需要特殊的算力。面對目前不斷出現的深度學習手機應用,ARM 一直在主推「異構計算」方式:使用手機晶片中的 CPU、GPU 和 ISP 協同工作承擔相應任務。

不過隨著華為麒麟、蘋果 A 系列晶片的成功,ARM 也在著手開發自己的機器學習 IP。2018 年 2 月,這家公司公布了針對人工智慧的計算晶片 Project Trillium 項目。本次 ARM 透露了自家「NPU」(神經網絡處理單元)晶片的能力。

ARM 表示,其最新的 NPU 可與 CPU 實現協同計算,提供高達兩倍的能效(5 TOPs/W),存儲器壓縮能力提升三倍。在與開源框架 ARM NN 共同使用的情況下,ARM NPU 的八核版本可以提供高達 32TOP/s 的算力。

ARM 的神經網絡晶片設計作為一個可選項目,即使客戶選擇的 A77 設計中不含有該晶片,其手機仍然可以通過 CPU、GPU 等處理器完成機器學習計算。Haas 表示,ARM 的優化工作已大幅提升了深度學習框架的性能,特別是 TensorFlow。

在活動中,ARM 高管,產品事業群總裁 Rene Haas 也被問及了與華為合作的問題,他表示:目前與華為終止合作仍存在很多變數,目前無法透露太多細節。

Rene Haas 在活動中。圖片來自 ettoday

ARM 提供晶片架構設計,具體實現還需要各家廠商的努力。在 2020 年,我們或許就可以看到採用新一代設計處理器的手機上市了。

參考連結:

https://www.anandtech.com/show/14385/arm-announces-malig77-gpu

https://www.anandtech.com/show/14384/arm-announces-cortexa77-cpu-ip

https://www.ettoday.net/news/20190527/1453760.htm

相關焦點

  • 樹莓派400已發布,「鍵盤」內置ARM晶片,連接顯示器就是一臺電腦
    【新智元導讀】樹莓派基金會近期發布了 Raspberry Pi 400,這是一款內置 ARM 計算機的緊湊型「鍵盤」。只需使用它的兩個微型 HDMI 埠之一將其插入電視或顯示器,插入 microSD 卡,連接電源線和滑鼠,就可以為自己安裝一臺基本的電腦,用於日常任務、編碼等。
  • 三波浪潮,看清「Arm伺服器晶片編年史」
    低調的炫耀一下,其實我最擅長的部分是TM-Traffic Manager 而不僅僅是處理器部分,這也是這家100多人的以色列公司(年營收大約$60M)最突出的特色。此處省略若干文字,真講起來,我能一個人講一周的培訓,收美金的那種。
  • 晶片的架構是什麼,不用ARM的架構可以嗎?
    晶片的架構也有異曲同工之妙,好的晶片架構可以帶來點石成金的魔法。晶片的架構就是如何在這方寸之間去建造一座微縮的宏偉城市,在城市中按照功能屬性的不同,劃分不同的區域,規劃道路和配套設施。大到一個區域要建幾層,每一層要放多少電晶體;小到電晶體怎麼放,道路是大一點還是小一點;細到城市中的電要怎麼配給、每條道路上的車輛該怎麼走,都歸晶片架構管。這樣形成的圖紙和文字說明就是架構。架構為什麼很重要從A點到B點,在A和B很少聯繫、每次要運輸的物資很少、A到B的道路也不擁堵,那麼目前這樣的設計是夠用的。
  • ...丨蜂窩物聯網晶片公司「智聯安」完成近億元A+輪融資,加速NB...
    36氪獲悉,蜂窩物聯網晶片公司「智聯安」已於近日完成近億元A+輪融資。本輪融資投資方為SIG海納亞洲創投基金,所募集資金將主要用於公司發展商業化並加大晶片測試及研發投入。「智聯安」全稱北京智聯安科技有限公司,成立於2013年9月,是一家物聯網應用領域晶片解決方案提供商,專業從事晶片設計,總部位於中國北京,在矽谷、武漢、合肥等多地設有子公司和技術研發中心。
  • 高通驍龍888發布背後,是ARM的野心和手機產業的狂歡
    ,這在之前高通旗艦晶片的發布史上,是罕見的。 三叢集的結構設計如今已經成為了幾乎所有移動晶片設計廠商所選用的主流設計,這一次高通更進一步,他們將原有使用相同架構的「超大核+大核」的固有結構下放,在全新的旗艦晶片上使用了「
  • CPU、GPU、TPU、NPU等到底是什麼?
    而TPU(Tensor Processing Unit, 張量處理器)就是谷歌專門為加速深層神經網絡運算能力而研發的一款晶片,其實也是一款ASIC。據稱,TPU與同期的CPU和GPU相比,可以提供15-30倍的性能提升,以及30-80倍的效率(性能/瓦特)提升。
  • 格羅方德推出優化新世代行動裝置的FinFET電晶體架構
    該公司推出的14nm-XM技術,將為客戶提供3D「FinFET」電晶體的效能及能源優勢,不僅可降低風險,更能加快上市時間,從而幫助無晶圓廠生態體系維持行動市場的領導地位的同時,開發出新一代的智慧行動裝置。   XM 是「eXtreme Mobility」的縮寫,為業界最頂尖的非平面式架構,真正為行動系統單晶片 (SoC) 設計做了優化,提供從電晶體到系統層級的完整產品解決方案。
  • 高通5G晶片驍龍888升級顯著 GPU實現迄今為止最大提升
    第三代高通5G晶片驍龍888,採用了全新半導體製程、全新處理器架構的高通5G晶片重新定義了「旗艦機型」性能和體驗,一經推出,便熱度不斷。本文引用地址:http://www.eepw.com.cn/article/202012/421414.htm
  • 微軟推出 ARM 架構 Windows10 模擬器
    今天微軟在開發者中心正式推出可以在 ARM 架構電腦上模擬 64 位 x86 程序的新版 Windows 10。目前像知名的 ARM 架構電腦已經可以升級到這個版本,目前測試人員已經測試了 Surface Pro X ,並且成功在 ARM 架構上運行 64 位的 .exe 文件。
  • 走Zen2的老路 AMD下下代GPU架構RDNA3或用小晶片設計
    從去年7月份開始,AMD的GPU開始全面轉向7nm RDNA架構,現在的Radeon 5000系列是第一代RDNA架構,今年還有big Navi/Navi 2X系列,會使用7nm+工藝的RDNA2架構,能效再次提升50%。
  • 蘋果推出下一代Mac晶片
    當前的 M1 晶片延續了以移動為中心(mobile-centric)的設計,該設計圍繞四個高性能處理內核構建,目的是加速諸如視頻編輯之類的任務。此外,晶片中的四個省電內核可以處理諸如網頁瀏覽之類的強度較小的工作。據知情人士透露,對於用在 MacBook Pro 和 iMac 機型的下一代晶片,蘋果正在設計 16 個功率核和 4 個節能核的晶片。
  • 英偉達「黃氏定律」讓未來的AI算力每年能夠提升一倍
    近十年來,GPU正在讓人工智慧算法的性能每年都在成倍提升,英偉達的研究人員通過架構的提升,正在不斷尋找進一步加快AI推理速度的晶片。 英偉達提出了以自己創始人黃仁勳名字命名的黃氏定律(Huang’s Law)對單晶片AI推理能力進行了預測,提出每 12 月其數字將翻一倍。
  • 蘋果自研ARM架構處理器推出時間預測,iOS將變得更開放、便利
    >搭載英特爾第十代晶片的MacBook產品二月中旬的時候,DIGItimes發文稱「高端」的iPad Pro會在秋季發布因為當時從供應鏈得到消息說其會搭載A4系列晶片和5G但幾天之後,卻又「反口」了Pencil的「玩法」確實是有欠缺雖然現在還不清楚這些「可添加」的部件最終會帶來怎樣的體驗但可想未來的Apple Pencil將不再是手寫筆那麼簡單蘋果會將它作為iPad的「遙控器」來打造有跡象表明,
  • 蘋果首發ARM架構電腦晶片,將對PC格局帶來哪些影響?
    那麼,在Mac系列上推出M1晶片的意義,就不僅僅是要開始和長期合作的Intel官宣「分手」這一層,還等於是要向x86統治下的PC市場「下戰書」了。 那麼,這次蘋果的ARM架構晶片想要挑戰現有PC格局還有多遠?這是本文重點關心的問題。
  • 三星Exynos 9925晶片曝光:集成AMD GPU
    10月17日消息,據外媒報導,三星新一代 Exynos 旗艦晶片預計將會被命名為 Exynos 2100,據說該晶片將對標即將發布的高通驍龍 875 旗艦處理器,三星 Galaxy S21 系列旗艦機型將率先首發。撰文 | Ho姐兒
  • 旗艦晶片+全新OS:vivo X60背後的雙飛輪效應
    01晶片前置定義再進一步12月初,vivo宣布新一代旗艦手機X60系列即將發布,將首發搭載Exynos 1080旗艦晶片。相比去年發布的旗艦處理器採用的7nm DUV相比,性能提升7%,功耗降低18%。另一個備受關注的重點,是Exynos 1080的架構優勢。
  • 地平線發布車規級AI晶片「徵程3」,「徵程5」性能超越特斯拉FSD
    過去5年,地平線從中國第一家AI晶片公司,到中國第一款車規級AI晶片,走過了漫漫徵程。 「徵程3」採用16納米工藝,基於地平線自主研發的BPU2.0架構,AI算力達到5 TOPS,典型功耗僅為2.5W,具有高性能、低功耗、拓展性強、安全可靠的特點,已通過AEC-Q100認證。
  • 蘋果下一代自研Mac晶片將採用12核心CPU 16英寸MacBook Pro率先搭載
    蘋果下一代自研Mac晶片將採用12核心CPU 16英寸MacBook Pro率先搭載 來源:TechWeb • 2020-11-26 10:19:35
  • MIPS架構與ARM架構
    倒也並非龍芯不想發展X86架構的桌面CPU市場或者ARM架構的行動裝置市場,是因為這兩家的授權太過於苛刻。X86的授權Intel已然不可能再授權。ARM是一家晶片設計公司,只能給出使用授權,不會同意讓龍芯自行設計。只有MIPS才可行,MIPS的授權說白了就是隨便抄隨便改。
  • 巨頭加速切換ARM架構,晶片行業格局將"改朝換代"?
    近日有外媒透露,AMD實際上已經研製出與蘋果M1處理器對標的ARM晶片。而且該晶片的原型共有兩款,一款採用集成RAM,另一款則沒有。 湊巧的是,此前"雙十一"凌晨,蘋果才發布了首款採用了ARM架構的電腦處理器M1,與此同時也發布了三款搭載M1處理器的產品。 不僅如此,最近微軟、谷歌內部和ARM架構相關的消息也有傳出。