2024年初,蘋果推出了M4處理器,令人意外的是,它的發布距離M3發布僅僅過去了半年時間。更讓人驚訝的是,M4首次亮相于iPad Pro。這一新處理器不僅僅是M3的簡單升級版本,而是一次全面的架構優化。本文將詳細分析M4處理器的架構、性能和能效,探討其在未來Mac和iPhone上的潛力。
M4芯片簡介
工藝與架構
M4處理器采用臺積電的第二代3nm工藝(N3E),成為首款使用N3E工藝的處理器。相比M3使用的N3B工藝,N3E理論上能提供更高的性能上限。蘋果在發布會上提到,M4的CPU部分再次提升了大核架構。這次的改進不僅是M3的簡單改良,而是對微架構進行了進一步優化。
性能與頻率
M4在被動冷卻設備中的峰值頻率達到了4.5GHz,這對于iPad來說是前所未有的。小核的頻率也達到了2.88GHz,與英特爾當前一代Core Ultra 5的水平相當。GPU方面,M4基本上是M3 GPU的優化版,頻率從1.34GHz提升至1.47GHz。NPU(神經處理單元)部分,蘋果首次在發布會上大量提及“AI”,并聲稱其NPU性能優于市場上所有的“AIPC”。
M4還采用了頻率更高的LPDDR5-7500內存,而非預期的LPDDR5X內存,可能是為了降低延遲。內存帶寬對于NPU和GPU都至關重要,這一提升為AI應用提供了更好的支持。
CPU微架構分析
前端與后端改進
M4的大核相比M3有顯著提升。其解碼單元寬度從M3的9擴大到10,這意味著每個時鐘周期可以解碼更多指令。前端解碼單元的擴大通常對應著更強的后端處理能力,M4的新架構顯著增加了Dispatch Buffer和浮點單元的調度隊列,提高了內核的并行性。
SME單元的引入
M4引入了SME單元,相當于ARM版本的AVX512,P核和E核簇各有一個SME單元,共享L2緩存。支持SME的程序在性能上將有大幅提升。這一改進主要是為了加速未來的AI應用。
內存與緩存性能
M4的內存延遲顯著低于M3,從約96ns降低到88ns,主要得益于LPDDR5-7500內存的使用。小核部分,M4仍采用A17 Pro和M3的小核微架構,但頻率更高。
性能測試
SPEC2017測試
在SPEC2017測試中,M4的大核峰值性能相比M3提高了近20%。然而,這種性能提升也帶來了顯著更高的功耗,峰值功耗比M3高出60%。在常溫下,M4的頻率策略會更保守,單線程頻率為4.4GHz,多線程頻率為3.94GHz。這種頻率策略類似于Intel和AMD的PC處理器。
GeekBench測試
在GeekBench 6.3中,M4的表現顯著提升,增加SME支持后,M4的跑分大幅提高。在GeekBench 5中,M4的單核性能比M3高17%,多核性能比M3高25%。與M2相比,M4的單核和多核性能分別提高了近50%。
能效分析
同頻能效方面,M4的大核在高頻能效上沒有顯著改善,但在低頻能效上有小幅提升。總體來看,M4在性能上的提升主要得益于架構改進,而非工藝優化。
游戲性能
我們測試了M4在《原神》和《崩壞:星穹鐵道》中的表現。在高分辨率下,M4的iPad Pro能以60fps穩定運行,但在解鎖120fps后,幀率有所下降。M4的GPU頻率提升了10%,帶來了相應的性能提升,但能效改善不大。
電池續航
在300nit屏幕亮度下,M4 iPad Pro的電池續航相比上一代有顯著提升,特別是13英寸版本的續航幾乎翻倍。這主要得益于新一代OLED屏幕顯著降低了整機功耗。
總結
M4在性能上有顯著提升,但能效改善有限,表明半導體工藝的進步可能快到頭了。未來,我們需要更多的架構改進來繼續提升性能和能效。總體來看,M4處理器在架構和性能上有了顯著的進步,但N3E工藝并未帶來預期的能效提升,未來的性能提升將更多依賴于架構優化。