功耗優化多過性能 ARM Cortex-A73解析

2020-12-20 中關村在線

1ARM新架構Cortex-A73解析

    雖然目前智慧型手機和平板之類的設備已經對極致性能沒有了太多的訴求,但VR又成了下一個著力點,近日ARM就在Computex 2016上公布了可以說是為VR設備的沉浸式體驗準備的Cortex-A73新架構,均對VR的性能和顯示需求做好了準備。


功耗優化多過性能 ARM Cortex-A73解析

    回顧一下前任A72,作為big.LITTLE架構裡的大核在今年的主流市場得到了廣泛應用,驍龍650裡有兩個,驍龍652裡有四個,麒麟950/955裡有四個,聯發科Helio X20/X25裡有兩個,當然考慮到各自的不同定位,工作頻率及製程工藝上的選擇都各有不同;從產品分布可以看出,今年的Cortex-A72並不如前任Cortex-A57那樣在高端市場吃香(驍龍810、Exynos 7420),三星用了半自主架構,而高通則徹底回到自主架構。



2A9~A73發展歷史回顧

    拋開那顆著名的壽命極長、高能效比的Cortex-A7不說,Cortex-A9是對於ARM來說極為重要的裡程碑,採用該架構的平臺——諸如蘋果A5、三星Exynos 4210/4412、德儀OMAP 4430/4460都證明了A9的成功。

    之後便是毀譽參半的Cortex-A15,性能相比之前突飛猛進的同時帶來了不小的功耗和發熱問題,比如Exynos 5250/5410都受其影響,再想想當年的核彈Tegra 4什麼的……

    而看到這一問題的ARM也在隨後推出了著名的big.LITTLE架構,隨之誕生了全球首款真八核Exynos 5422,以及麒麟920等平臺。

    隨著Cortex-A57的登場,ARM陣營正式邁入ARMv8 64位指令集時代,當然這也是蘋果A7的功勞,與Cortex-A53結合的大小核架構成為了隨後的主流,其中出現了4大4小、2大4小、不同頻率的兩組4小各種組合方式,並流傳至今;其中有人歡喜有人愁,三星靠Exynos 7420成功奪得眼球,而驍龍810則因為發熱問題成為了一代尷尬的旗艦。

    在這些主流微架構之外,還有2013年7月公布的Cortex-A12以及2014年2月公布的Cortex-A17,短命和不受待見沒讓其成為主流,只有MT6595這樣極少的平臺採用。


3A17家族而非A72升級

    而此次的A73並非是簡單的A72升級,這還要從ARM的家族劃分說起,A15、A57、A72屬於Austin家族(來源於ARM位於美國德州奧斯汀的設計中心),而A5、A7、A53則屬於Cambridge家族(名字來源於ARM總部英國劍橋),A12、A17以及剛剛公布的A73屬於Sophia家族(名字來源於歐洲最大科技園區索菲亞,也就是ARM法國CPU設計中心所在地)。

    雖然命名上Cortex-A73看似是A72的升級,但是從技術層面講,它其實是A17的進化版本,整體微架構、流水線、寬度設計都與之類似,反而和A72差別很大,並且,A73也沒有保留A72的三發射,而是採用了與之前的Sophia家族微架構相同的雙發射。而ARM此次的宣傳顯然也是側重能效而非性能,對於前兩代動輒5W甚至10W的峰值功耗來說,ARM期待Cortex-A73能夠長效的保持高性能,而不是因為短暫高頻運行後發熱降頻,換句話說,要持久…

    對比一下A73與A72的流水線圖,你就能發現設計思路上的顯著不同。Cortex-A72採用了15級以上的亂序流水線設計、128位預取指令、3發射解碼、每個時鐘周期分配最多5個微操作、滿足最多7個發射隊列進入8個執行流水線。


    而A73的設計頗似A17,流水線深度較A72有所減少,預取階段從A72的5級減少為4級,進入浮點流水線的微操作還經過一個額外的取指階段,整個流水線只有11~12級。


    由此可以看出A73的設計基於跟A17相同的邏輯,通過優化流水線、資源和接口來在可實現的最小功耗水平上獲取最高的性能。ARM也表示他們還特別進行了32位/64位狀態下的平衡優化。

    性能提升上,ARM表示A73在所有重要的移動應用上都具備超越A72的性能表現,不過給出的對比倒是不多,比如BBench網頁載入測試性能相比A72提升10%,FFMEG解碼多媒體性能提升5%,內存存取性能提升15%。


    而更被看重的性能方面,整數應用當中A73有25%的功耗降低,浮點和二級緩存應用當中有30%左右的降低,ARM也表示在相同的頻率下,A73整體相對於A72有著20%的功耗降低。 




    10nm製程讓A73的尺寸在相同性能下比A72小25%,因此雙核A73的尺寸基本跟四核A53相同,特別是在如今眾多採用4+4 A53設計的處理器性能表現並不搶眼的情況下,這一組合有望被2xA73+4xA53的設計替代,在核數減少單線程性能大幅提升的同時保持相同的晶片面積。


相關焦點

  • ARM7、ARM9、ARM11、ARM-Cortex系列的關係
    ARM7、ARM9、ARM11、ARM-Cortex的相同點ARM7:ARMv4架構,ARM9:ARMv5架構,ARM11:ARMv6架構,ARM-Cortex 系列:ARMv7架構 ARM7沒有MMU(內存管理單元),只能叫做MCU(微控制器),不能運行諸如Linux、WinCE等這些現代的多用戶多進程作業系統, 因為運行這些系統需要MMU,才能給每個用戶進程分配進程自己獨立的地址空間
  • ARM Cortex系列(A8/A9/A15/A7) NEON多媒體處理SIMD引擎優化
    降低功耗來提高能效;提高最高性能,滿足要求更高的應用需求;能夠在多個設備之間共享軟體和工具投資;Cortex-A9 MPCore多核處理器集成了經驗證非常成功的ARM MPCore技術以及更多增強功能,以此簡化了多核解決方案,並使其應用範圍得到擴展。
  • 從Cortex-M到Cortex-A全面認識ARM處理器
    ARM的技術將一個充滿活力的生態系統與超過1000個合作夥伴相結合,提供晶片,開發工具和軟體,以及超過900億個處理器,ARM的技術是計算和連接革命的核心,正在改變人們的生活和業務運營方式。下面帶你了解Cortex-M到Cortex-A的各系列處理器。
  • 性能暴增30%還省電!ARM Cortex-A73架構解讀
    ARM今天發布了全新的旗艦級CPU Cortex-A73,代號Artemis,10nm FinFET工藝下面積還不到0.65平方毫米,而頻率可高達2.8GHz,峰值性能、持續性能都可比A72提升最多30%,華為海思、三星電子、聯發科、Marvell等都已經籤署授權。
  • ARM出低功耗Cortex-A7晶片
    泡泡網CPU頻道10月21日 一直以來由於性能的低下,ARM都在走性能發展路線,雖然由於簡化的流程以及高度整合,功耗控制在一個比較合理的位置,但是智慧型手機脆弱的續航時間,使得晶片不得不做出一定的讓步,或降低頻率或增大電池容量。
  • stm32屬於arm嗎_arm和stm32的區別
    stm32屬於arm嗎?   就一般來看,STM32屬於高性能的單片機,一般運用的場合多為應用控制,它主要是和51,AVR等競爭低端單片機市場,優勢在於處理速度相對較高(F4現在最高180M),片上資源較為豐富。ARM的話,一般人們說ARM都是指的片上系統,如果把ARM當單片機用,性價比是不夠高的。 stm32屬於arm嗎?
  • Arm技術文檔分享|Cortex-M 系列處理器Cortex-M3 DesignStart FPGA...
    ARM Cortex-M 系列是一系列針對成本敏感的應用程式進行優化的深層嵌入式處理器。這些處理器僅支持 Thumb-2 指令集。此系列包含 Cortex-m4、Cortex-M3、Cortex-M1 FPGA 和 Cortex-M0 處理器。ARM Cortex-M4 處理器是一個低能耗處理器,特點是門數低、中斷延遲短且調試成本低。
  • ARM發布全新CPU Cortex-A35:64位 超低功耗
    ARM宣稱,A35是其有史以來能效最高的處理器,目標功耗不超過125毫瓦,而且已經在28nm工藝、1GHz頻率下做到了90毫瓦,因此採用16/14nm工藝的話,可以在保持功耗不變甚至更低的前提下,輕鬆超過2GHz。
  • 新的ARM Thumb-2內核技術帶來了業界領先的代碼密度和性能
    ARM Thumb-2內核技術進一步改良了代碼密度,也帶來了更優化的性能。ARM的Thumb-2新技術,將能為嵌入式應用產品提供更合理的功耗性能,從而為其合作夥伴們在注重成本的嵌入式應用系統開發中提供了強大的發展潛能。」
  • ARM Cortex-A35構架分析
    A53,根據需求,它可以以多核,或者 big.LITTLE大小核的形式工作;而超低功耗系列,在A5和A7之後,現在新增了A35。而A35這次主推能耗比,其實是在給當年吹過能耗比的A53打臉。不過從戰略意義上說,A35帶來的最重要改變,是讓Cortex-A系列上中下三路產品,都用上了64位的ARMv8構架。在A5/A7等老構架退休後,它就可以完成「全家64位」的宏願了。
  • 使用市面上首款基於 Arm® Cortex®-M33 的 MCU –第 1 部分...
    不過,對更高性能和更低功耗的需求卻是大多數主流應用領域的共同主題。 例如,智能工廠不僅依賴於低延時、高性能器件(用於信號處理),而且要求降低功耗,以便工廠工程師能在狹小空間中容納更多器件。消費類可穿戴設備不僅需要低功耗設計以延長電池續航時間,而且面臨著不斷增長的信號處理需求,以便能夠處理更複雜的工作負載。
  • 解析arm 2440和6410有什麼區別
    本文引用地址:http://www.eepw.com.cn/article/201808/385528.htmarm處理器是英國Acorn有限公司設計的低功耗成本的第一款RISC微處理器。全稱為Acorn RISC Machine。arm處理器本身是32位設計,但也配備16位指令集,一般來講比等價32位代碼節省達35%,卻能保留32位系統的所有優勢。
  • 如何選擇更適合你的ARM Cortex內核?
    與此同時,這些處理器也具有極高的設計靈活性,能夠提供所需的最佳性能和預期的功效。  儘管Cortex-A5內核是Cortex A系列中體積和功耗都最低的成員,但它擁有支持多核性能的潛能,並且與該系列中的高級成員(A9和A15)兼容。對於那些之前採用ARM926EJ-S或 ARM1176JZ-S處理器的設計人員來說,選擇A5是自然的,因為它具有更高的性能和更低的晶片成本。
  • 新Atom平臺細節解析 性能與功耗實測
    新Atom平臺細節解析 性能與功耗實測 出處:快科技 2009-12-21 17:01:38     作者:上方文Q 編輯:上方文Q[爆料]今天,Intel又將Atom帶到了新高度:同樣的45nm工藝架構,但一口氣整合了圖形核心、顯示輸出單元、內存控制器、DMI總線(也就是原來的北橋晶片),同時雙核心升級成原生設計,從而演化成了集成度更高、功耗更低的雙晶片平臺。
  • ARM發布Cortex-A35架構:史上最高能效比
    雖然看名字和Cortex-A53有些相似,但Cortex-A35其實是Cortex-A5與Cortex-A7的繼任型號,主打超高能效比與低功耗。  據ARM介紹,Cortex-A35是其有史以來能效比最高的處理器,其目標功耗是不超過125mW。從實際應用來看,Cortex-A35已經實現在28nm工藝,1GHz主頻下做到了90mW的功耗。
  • 恩智浦推出基於ARM Cortex-A7的業界功耗最低處理器,助推物聯網發展
    本文引用地址:http://www.eepw.com.cn/article/201609/310609.htm  恩智浦資深副總裁、微控制器業務總經理Geoff Lees表示:「成本效益、易用性和低功耗對是物聯網創新性應用取得成功的重要因素,i.MX 6ULL已將三者發揮到極致。
  • 賽靈思將數據中心單位功耗性能提升25倍
    數據中心運維人員總是不斷在尋求更高的伺服器性能,尤其是隨著雲計算的發展帶來數據中心的流量激增。目前,他們主要是通過易於編程的多核CPU和GPU來開發應用,但CPU和GPU都遇到了單位功耗性能的瓶頸壁壘。從事海量數據中心應用開發(如密鑰加速、圖像識別、語音轉錄、加密和文本搜索等)的設計人員既希望GPU易於編程,同時又希望硬體具有低功耗、高吞吐量和最低時延功能。
  • 臺積電ARM Cortex-A57 處理器設計定案
    Cortex-A57處理器為ARM旗下性能最高的處理器。ARM與臺積電從合作到Cortex-A57成功流片僅用時六個月,而且今後臺積電的20/16nm工藝將繼續為ARMv8架構進行全方位的優化,包括性能、功耗和能效方面。
  • 雙發機制有效降低TWS耳機功耗 讓性能與功耗背向而行
    雙發機制有效降低TWS耳機功耗 讓性能與功耗背向而行 自iPhone 7發布以來,市面上開始逐漸盛行手機不設置耳機孔的慣例。
  • ARM的年度迭代策略 ARM Cortex-A77架構好在哪裡
    ARM最新發布的Cortex-A77,其代號為「Deimos(戴莫斯,畏懼之神),採用了和A76一脈相傳的CPU微架構,並在其基礎上進行了一定的優化,並最終獲得了更高的IPC性能提升。 根據ARM公布的數據來看,在同樣使用7nm製程工藝、同樣運行在3GHz頻率下時(僅限於理論,實際量產的旗艦SoC主頻多在2.6GHz~2.8GHz之間),新的Cortex-A77比起前代的Cortex-A76,內存帶寬提升了20%、在SPEC int2006和Geekbench 4有著20%的性能提升,浮點定性能則有30-35%的提升。