ARM推出下一代旗艦晶片架構,GPU提升60%,「NPU」即將上線

2021-01-08 手機鳳凰網

5月27日,ARM於臺北COMPUTEX 2019大會開幕前發布了下一代旗艦機手機晶片設計方案,其中包括全新CPU Cortex-A77、新GPU Mali-G77。這家公司還首次公開了新一代神經網絡晶片ARM ML,所有這些預計將會在2020年上市。

ARM 表示,新的晶片展示了該公司在 5G 融合、物聯網、人工智慧(AI)與自動駕駛領域的投入。

Arm IP 產品事業群總裁 Rene Haas 在發布會上。

Cortex-A77:製程不變,性能提升 20%

對 Arm 自己的 CPU 設計來說,2018 年是個不錯的年份。去年 5 月,我們看到了 Cortex-A76 的發布,以及後續的麒麟 980 和驍龍 855 晶片。從人們購買的反應就可以看出來——這代晶片令人印象深刻,而 Arm 成功實現了其在性能、效率和領域方面的所有承諾,為 2019 年的大多數旗艦手機提供了出色的晶片和設備。

今年,Arm 跟進了另一項技術,Cortex-A77——Cortex-A76 的繼任者。這一代 CPU 將是對去年主要微架構的直接進化,代表了 Arm 全新 Austin 內核系列的第二個實例。

Cortex-A77 不僅適用於手機,也可用作筆記本處理器,Arm 稱其性能已經超越 14nm 製程的英特爾酷睿 i5-7300U。

代號 Deimos

新的晶片架構 Cortex-A77 代號為 Deimos。它將 Cortex-A76 終止的地方作為起點,並遵循 Arm 的計劃軌跡,即每一代新的 Austin 系列 CPU 性能都能持續提升 20-25% 的 CAGR。

說到這裡,就有必要提一下 Cortex-A76 的性能了。

A76 對 Arm 及其授權廠商來說無疑是一款非常成功的內核。全新微架構和臺積電 7nm 製程工藝的結合,帶來了業內有史以來最大的性能和效率提升。結果就是麒麟 980 和驍龍 855 相對於各自的上一代手機晶片都有很大的性能飛躍。

雖然 A76 表現不錯,但競爭對手也沒有停滯不前。三星的 Exynos(獵戶座)處理器相比其上一代產品就有很大提升,製程是 8 納米。而真正的對手蘋果當前的 A11 和 A12 架構在性能和效率方面仍然遙遙領先,Arm 與它的差距大概是兩代微架構。

圖片來自 ChipRebel

Cortex-A77 概述

Cortex-A77 直接繼任了微架構 A76 意味著新的內核基本與先前的特性保持一致。Arm 表示,內核是為廠商設計的,他們無需太費力就可以輕鬆升級晶片 IP。

實際上,這意味著 A77 與其前身 A76 在架構上是一致的,仍然以 ARMv8.2 為 CPU 內核,並且與 DSU(DynamIQ Shared Unit)集群內部的 Cortex-A55 小 CPU 配對。

A77 的緩存大小等基本配置特性與前身也沒有太大區別:仍然是 64KB 的 L1 指令和數據緩存,以及 256 或 512KB 的 L2 緩存。有趣的是,Arm 的確為基礎設施 Neoverse N1 CPU 內核(源自 A76)設計了 1MB L2 緩存選項,但選擇保留客戶端(移動)CPU IP 的較小配置選項。

作為 A76 的進化版,不論是從微架構還是從絕對性能的角度來看,A77 的性能提升都沒有預期中那樣令人驚豔。

A77 將還是採用 7 納米製程,Arm 宣布它的峰值目標頻率與前身一樣為 3GHz。自然而然地,由於頻率不會有太大變化,這意味內核的 20% 性能提升只能歸因於 IP 的微架構變化。

為了實現 IPC(Instructions per clock) 增益,Arm 重新設計了微架構並引入了巧妙的新特性,總體上增強了 CPU IP,從而實現了更寬、更高性能的設計。

Mali-G77:全新架構,機器學習性能提升 60%

在 2019 年,全球遊戲市場產值將高達近 1500 億美元,這將是全球最大營收的市場之一。ARM 昨天推出的新一代移動端 GPU 將承載其中與日俱增的計算需求。

Mali-G77 採用了全新的 Valhall 架構,這是繼上代 Bifronst 架構發布三年之後的又一次重大升級。在性能上,與上一代的 Mali-G76 GPU 相比,Mali-G77 具有近 40% 的性能提升。同時 Mali-G77 還在關鍵的微構架上進行強化,包括引擎、texture pipes 和 load store caches,並將功耗效率以及性能密度均提升了 30%。

除此之外,Mali-G77 同時帶來 60% 的機器學習性能提升,顯著提升推理與神經網絡性能,以支持更多的人工智慧應用。新的晶片設計將為開發人員提供更大的發揮空間,為移動 APP 生態催生出更多的新形式交互體驗。

Bifrost 架構的最後一次迭代——Mali-G76,對 Arm 來說是一次重大的飛躍,其 IP 在很大程度上解決了前身的一些關鍵問題,為 Exynos 9820 和麒麟 980 晶片組帶來了相對較好的結果。

但是,Arm 在迎頭追趕並努力解決 Bifrost 問題時,其對手也沒有閒著。高通的 Adreno GPU 架構已經引領移動領域好幾年了。儘管今年的 Adreno 640 沒有帶來令人印象深刻的進步,但在性能、效率和密度方面,它仍然領先 Arm。並且,蘋果 A12 的 GPU 在性能、效率方面帶來的絕對是一個重大飛躍,即使是高通最好的 GPU 也與之相去甚遠,更不要說 Arm 的了。

Valhall GPU 的第一次迭代即是 Mali-G77,它實現了一些架構上和微架構的改進。

Arm 承諾在能效和面積密度(在 ISO 性能和製程方面)方面會有 30% 的增益,而 GPU 上機器學習推理工作負載的性能會提升 60%。

更有趣的是,Arm 表示在即將到來的 2019 年底和 2020 年,SoC 將預計比 2019 年的設備性能提升 40%。下一代 SoC 將只有微小的製程節點改進,所以這裡說的 40% 增益將主要來自 Mali-G77 GPU 在架構和微架構上的飛躍。

神經網絡處理器 ARM ML

人工智慧正在成為便攜設備中不可或缺的組成部分,拍照中的場景識別、增強現實中的物體識別都需要特殊的算力。面對目前不斷出現的深度學習手機應用,ARM 一直在主推「異構計算」方式:使用手機晶片中的 CPU、GPU 和 ISP 協同工作承擔相應任務。

不過隨著華為麒麟、蘋果 A 系列晶片的成功,ARM 也在著手開發自己的機器學習 IP。2018 年 2 月,這家公司公布了針對人工智慧的計算晶片 Project Trillium 項目。本次 ARM 透露了自家「NPU」(神經網絡處理單元)晶片的能力。

ARM 表示,其最新的 NPU 可與 CPU 實現協同計算,提供高達兩倍的能效(5 TOPs/W),存儲器壓縮能力提升三倍。在與開源框架 ARM NN 共同使用的情況下,ARM NPU 的八核版本可以提供高達 32TOP/s 的算力。

ARM 的神經網絡晶片設計作為一個可選項目,即使客戶選擇的 A77 設計中不含有該晶片,其手機仍然可以通過 CPU、GPU 等處理器完成機器學習計算。Haas 表示,ARM 的優化工作已大幅提升了深度學習框架的性能,特別是 TensorFlow。

在活動中,ARM 高管,產品事業群總裁 Rene Haas 也被問及了與華為合作的問題,他表示:目前與華為終止合作仍存在很多變數,目前無法透露太多細節。

Rene Haas 在活動中。圖片來自 ettoday

ARM 提供晶片架構設計,具體實現還需要各家廠商的努力。在 2020 年,我們或許就可以看到採用新一代設計處理器的手機上市了。

參考連結:

https://www.anandtech.com/show/14385/arm-announces-malig77-gpu

https://www.anandtech.com/show/14384/arm-announces-cortexa77-cpu-ip

https://www.ettoday.net/news/20190527/1453760.htm

相關焦點

  • 「超大核」加持,ARM新一代移動架構超越蘋果A系列
    在相同的功耗水平上,A78 的性能提升了 7%。全新 Cotex-X1:打破功耗約束Arm 現有的業務模型一直在嘗試構建最廣泛用戶所需要的晶片,但這也產生了一個悖論:性能、功率和面積三者只能取其二。儘管可以肯定的是,蘋果的 CPU 內核在技術上是強大的,但 Arm 性能劣勢的一個重要因素是其業務需求不支持構建一個「超大核」。
  • AMD在華首次展示Fusion晶片 全球首發第二代DirectX 11 GPU並曝光...
    會上,AMD的多位高管詳細闡述了AMD的創新成果與技術趨勢,展現了AMD 在CPU和GPU設計方面的綜合實力和未來發展全景:·全球首發第二代DirectX 11顯卡Radeon HD 6800系列,將GPU顯示技術提升到更高層次,使視覺體驗實現了全新飛躍。·曝光代號為「Bulldozer」和「Bobcat」的下一代處理器架構核心,為用戶實現超低功耗和超高效率的計算。
  • 華為Mate40 Pro曝光:五攝+麒麟1020+A78架構
    編輯 | 黑貓如果你近期打算購買華為旗艦手機,一定會在華為Mate30和華為P40之間糾結。兩者都是華為的當家旗艦,華為P40系列的顏值更好看,攝像頭更強。但是,麒麟990相對於上一代的提升並不是很大。
  • Arm 推出A78/X1 CPU 架構:5nm 工藝,面向大核與超大核設計
    Arm 近日推出了 Cortex-A78 和 Cortex-X1 CPU 架構,面向移動處理器的大核與超大核,兩者都採用 5nm 工藝,相關產品預計將在 2021 年開始發貨。根據官方描述,Cortex-A78 和 X1 都基於目前的 Cortex-A77 架構,但是兩者的設計目標不同。前者側重與提供更高的每瓦性能,也就是更加在乎功耗表現,同時體積較小。Cortex-X1 則是追求更高的性能。所以 Cortex-A78 可以看成 A 系列的正常迭代產品,Cortex-X1 則是 Arm 在高性能領域的進一步探索。
  • 英特爾全新電晶體性能提升可媲美節點升級 計算架構新黃金十年開啟?
    在今天的架構日上,英特爾首次詳細介紹了可實現全擴展的Xe圖形架構。Xe圖形架構有Xe-LP、Xe-HP、Xe-HPC三個系列,加上今天新推出的Xe微架構變體Xe-HPG,目前已有四個系列Xe微架構。首款Xe-HP晶片已於實驗室完成啟動測試。目前,英特爾現在正在與關鍵客戶一起測試Xe-HP,並計劃通過Intel  DevCloud使開發者可以使用Xe HP。Xe-HP產品將於明年推出。Xe-HPG是英特爾推出的最新Xe微架構變體,是為遊戲優化的微架構。
  • 微信推出「狗頭」等 10 個新表情 / 蘋果或在研發 5G 版 iPad /...
    原標題:微信推出「狗頭」等10個新表情/蘋果或在研發5G版iPad/微信支持轉帳到QQ先與AppSo的讀者們分享個喜訊。1月14日,微信新增了一組默認表情,包括了「吃瓜」、「加油」、「汗」、「天啊」、「Emm」、「社會社會」、「旺柴」、「好的」、「打臉」、「哇」。
  • 推動ARM伺服器晶片替代X86,華為、飛騰扛起國產化大旗
    參考海外研究統計數據,AMD 曾推出皓龍系列,2006 年其伺服器 CPU 市場份額一度超過 20%,但英特爾推出至強系列伺服器晶片後,市佔率快速提升,近年來伺服器晶片市場基本被英特爾壟斷。英特爾伺服器相關業務營收規模達到 229.91 億美元。
  • 「東京喵喵」即將推出新動畫「東京喵喵NEW~♡」
    「東京喵喵」即將推出新動畫「東京喵喵NEW~♡」 動漫 178動漫整編 ▪
  • 2021索尼電視新品匯總:世界首款認知智能電視來了,新晶片很能打
    這個「重磅級新品電視」終於在今天揭開了面紗。索尼今年將電視產品從 CES 發布會中單獨拎了出來,專門召開了一場電視新品發布會,像是在為下周的 CES 大會預熱。在這場剛剛結束的發布會上,索尼發布了一款全新的 XR 認知晶片「Cognitive Processor XR」,以及 5 款搭載該晶片的電視,可以說看點滿滿。
  • 教程 | 如何在Julia編程中實現GPU加速
    為了簡化操作,可以在 nextjournal 上註冊帳戶,點擊「edit」即可直接運行文章中的簡單代碼了。註冊地址:https://nextjournal.com/signup首先,什麼是 GPU?能夠啟動的並行線程可以大幅提升速度,但也令使用 GPU 變得更困難。當使用這種未加處理的能量時,會出現以下缺點:GPU 是一種有專屬內存空間和不同架構的獨立硬體。因此,從 RAM 到 GPU 內存(VRAM,顯存)的傳輸時間很長。
  • 高通首款集成式5G晶片曝光!採用X1超大核:性能直接擠爆牙膏
    【9月25日訊】導語:對於ARM最新發布的晶片架構也是引起了廣大網友們高度關注,因為ARM公司不僅僅推出了常規升級版本—A78 CPU核心架構和G78 GPU架構,同時還首次推出了Cortex-X1 超大核心CPU架構,相對比A78 CPU核心架構,整體性能提升更是高達23%,對比上一代Cortex-A77,單核心性能更是直接提升
  • 麒麟810耗資數億 4點深挖全球唯四7nm旗艦神U
    通過摩爾定律我們可以知道,製程工藝的數字越小,晶片中的電晶體密度就越高,單位面積內能集成的電晶體數量越多,處理器性能的提升也就更強了。這樣最終的效應回饋於消費者,品牌形象的樹立就更能深入人心了。04  NPU首次採用達文西架構 AI性能最強,沒有之一榮耀9X被熊軍民稱為「跳級生」,因為在麒麟810的AI運算能力的加持下,有著驚人的「越級」表現,麒麟810幾乎超越了目前所有已知的旗艦手機晶片。
  • 移動圖形晶片超越桌面電腦_筆記本電腦_筆記本新聞...
    ATI近日發表首款採用臺積電0.13微米Low K低介電質製程的筆記型計算機繪圖晶片產品Mobility Radeon 9700,何國源表示,低介電質製程約可以提升10~15%的晶片效能以及節省耗電,未來勢必是筆記型計算機晶片的主流製程。
  • 小米回應「員工需籤軍令狀放棄年終獎」;滴滴上線"特惠拼車"功能...
    最新消息顯示,360 公司對「網紅雲商」吳海濤的起訴案將於近期擇日開庭。此前360公司發表聲明稱,「網紅雲商」未經許可大肆使用 360 公司及董事長周鴻禕的名義進行宣傳,在 360 公司致電、發函警告後仍未停止侵權行為。360 公司曾於 2016 年 12 月投資了北京飛揚天下文化傳媒有限公司。
  • 喜茶上線天貓卻不賣奶茶,攜「周邊」玩起了IP生意?
    與奈雪の茶天貓店裡以茶葉產品和禮品卡為主有所不同,喜茶天貓旗艦店以聯名和周邊產品為主——包含「喜茶食驗室」、「靈感聯名」、「靈感周邊」三類產品;前段時間新推出的芝士夾心餅乾、喜茶牌希臘酸奶是主推產品;但在已上線的20種產品中,看起來有些」不務正業「的聯名款和周邊產品則佔據更大比例。
  • 蘋果M1 之後,英特爾再也不能隨意「擠牙膏」了
    相比之下,英特爾在大眾輿論中的形象多少有些尷尬,過去幾年來因為多代 CPU 之間性能提升幅度較小,還比 AMD 的 CPU 貴,被用戶調侃為「牙膏廠」。  曾經的 PC 領域霸主英特爾,怎麼就「落後」了呢?  一步慢,步步慢   和 Apple M1 晶片、AMD 最新的 Ryzen 晶片系列相比,英特爾被調侃最多的就是 CPU 工藝製程落後。蘋果 M1 晶片已經用上了 5nm 製程,AMD 的桌面級的處理器 Ryzen 系列也用上了 7nm 製程。
  • CES 2021前哨:LG首次官方介紹G1「OLED evo」,最大尺寸83寸
    LG 今日宣布了有關 2021 款 OLED 電視陣容的首批細節,其中包括 G1「OLED evo」電視。LG 通過韓國媒體表示,LG 還將推出最大 83 寸的電視以及更新為第四代 Alpha 9 晶片。
  • 西尾維新全物語系列「貓物語」即將推出TV動畫?
    西尾維新全物語系列「貓物語」即將推出TV動畫? 憑物語   早在N久之前,新房昭之和西尾維新就做下了動畫化全物語系列的約定,也就是說,除了已經播出的「化物語
  • ...地平線聯合Linaro推出AIoT開發平臺BOOTPRINT X2 開發套件
    2019年11月1日,Linaro聯合地平線共同推出基於地平線旭日二代晶片的邊緣人工智慧開發套件BOOTPRINT X2 開發套件。BOOTPRINT X2是一款集"芯、邊、雲"一體的邊緣AI計算開發平臺,能夠為AI工程師、應用開發者以及企業合作夥伴的邊緣AI感知應用開發及驗證提供完整支持,大幅縮減AI解決方案開發的周期和成本。