文章目錄
- ARMv9 系列Core
- ARM Cortex-A510 介紹
- ARM Cortex-A715
- ARM Cortex-A720
ARMv9 系列Core
2021年5月Arm公布了其最新3款CPU和3款GPU核心設計,三款新CPU分別是旗艦核心Cortex-X2、高性能核心Cortex-A710、高能效核心Cortex-A510 CPU,三款新GPU核心則覆蓋高中端和入門級。
這是繼2021年3月推出重要的創新——全新64位指令集Armv9、2021年4月推出基于Armv9的首個產品——面向數據中心的Neoverse N2之后,Arm首次展示基于Armv9設計的一系列面向消費級移動設備市場的新核心,這些新設計不僅性能大幅提升,而且增加新的安全性和人工智能(AI)功能。
- Cortex-X2,它是Arm Cortex-X定制項目的一部分,允許合作伙伴幫助為其特定用例設計專用核心。作 為Cortex-X1 的繼任者,它也是Arm CPU產品線中強大的設計,可以用于筆記本電腦等大屏設備。Arm稱,與Cortex-X1比,Cortex-X2的性能將提高16%,機器學習性能提升2倍;
- Cortex-A710 “big” 核心 比 Cortex-A78 提高10%的性能、30%的能效、2倍的機器學習性能;
- Cortex-A510 “LITTLE” 高能效核心 取代自2017年推出的Cortex-A55設計。與老款A55相比,其性能提升35%,能效提高20%,機器學習性能提升3倍。
高通驍龍888芯片,即采用 Arm Cortex-X1 和Cortex-A78的部分定制版本作為其四個“大”核心,并使用Cortex-A55設計作為其“LITTLE”核心。
X2、A510都將是純64位,不再兼容32位,而A710會繼續支持OL0 AArch32。其中,X2和A710的前端都改進了分支預測,精度更高,錯誤更少。
憑借 L3 緩存和叢簇設計 DSU-110 的特性,單一叢簇(cluster)最多可容納8個X2 核心,并具有最大 16MB 的 L3快取能力。
ARM Cortex-A510 介紹
Cortex-A510是一個更大的微體系結構跳躍,因為它代表了Arm的 Cambridge CPU 設計團隊的一項新的 CPU設計。A510 在改進 IPC的同時仍繼續關注功率效率,并且也許最有趣的是,它保留了其有序的微體系結構特征。
A510則采用了一個混合核心微架構(merged core microarchitecture)新設計,可將2個A510組合成一個群組,單一CPU可由多個群組構成,從而實現更加彈性化的結構設計。兩個核心對它們共享L2緩存系統以及它們之間的FP / NEON / SVE pileline。
ARM 的 Merged-Core Microarchitecture 是 ARM 設計的新型微架構。這種微架構的主要特點是將多個物理核心合并為一個邏輯核心,以提高處理器的能效和性能。
在Merged-Core Microarchitecture中,每個物理核心都可以獨立運行指令,但是所有的物理核心都共享同一個指令流。這樣,當某個物理核心空閑時,它可以被用來執行其他核心的指令,從而提高整體的處理器性能。
ARM Cortex-A715
2022年8月 Arm又推出了他們的大核Cortex-A715(也稱為 Makalu)。A715 支持與 ARMv9.0 ISA 大致相同的幾項增強功能。更關鍵的是,A715的所有Exception Level都是僅支持AArch64(完全放棄了 32 位支持)。A715 的設計原則與之前的大核心相似:以更高的比率提高性能,而不是影響功率和面積。在這次迭代中,性能重點放在了整體改進上,而沒有顯著拓寬pipeline 或extending its depth。最后,Arm 工程師引入了受早期 Cortex-X 設計啟發的有針對性的改進,例如分支預測器和預取增強功能。
A715 的另一項改進是引入了 3 階段預測方案以實現快速周轉。以前,Arm 具有快速的 L0 0 周期預測和較慢的 2 周期預測結構,而在 A715 中,Arm 將其分解為三個階段,采用新的 1 周期周轉中間結構,從而減少了獲得預測的延遲。
隨著更高容量的分支預測器產生更高的分支請求帶寬,可能會遇到更多獲取兩個單獨指令流的實例。為了適應這一點,A715 現在支持更高的指令高速緩存查找帶寬,最高可達標簽/周期的兩倍。
ARM Cortex-A720
推薦閱讀: Cortex-A720
推薦閱讀:
https://aijishu.com/a/1060000000365445