一個計算密集小程序在不同CPU下的表現

本文比較了幾款CPU對同一測試程序的比較結果,用的是Oracle公有云OCI上的計算實例,均分配的1 OCPU,內存用的默認值,不過內存對此測試程序運行結果不重要。

本文只列結果,不做任何評價。下表中,最后一列為測試程序運行5次的平均耗時。

OCI shape名稱CPU 型號基本頻率(GHz)測試程序運行耗時平均值(秒)
VM.Standard3.FlexIntel Xeon Platinum 83582.6135.084
VM.Optimized3Intel Xeon 63543.0123.65
VM.Standard.E4.FlexAMD EPYC 7J132.5562.766
VM.Standard.E5.FlexAMD EPYC 7J132.453.22
VM.Standard.A1.FlexAmpere Altra Q80-303.0107.206

測試程序:

#include <stdio.h>
#include <math.h>void main()
{double r;int i, j;for (i=0; i< 100000; i++)for (j=0; j< 100000; j++)r = r + sqrt(sqrt(i));}

編譯:

cc -lm a.c

test.sh運行a.out 5次:

for i in 1 2 3 4 5; dotime -p ./a.out
done

求平均值可以將以上輸出存于臨時文件,例如/tmp/1,然后運行一下:

cat /tmp/1|grep real|sed  's/real //'|awk '{s+=$1} END {print s/5}'

Intel Xeon Platinum 8358

$ lscpu
Architecture:        x86_64
CPU op-mode(s):      32-bit, 64-bit
Byte Order:          Little Endian
CPU(s):              2
On-line CPU(s) list: 0,1
Thread(s) per core:  2
Core(s) per socket:  1
Socket(s):           1
NUMA node(s):        1
Vendor ID:           GenuineIntel
CPU family:          6
Model:               106
Model name:          Intel(R) Xeon(R) Platinum 8358 CPU @ 2.60GHz
Stepping:            6
CPU MHz:             2594.024
BogoMIPS:            5188.04
Virtualization:      VT-x
Hypervisor vendor:   KVM
Virtualization type: full
L1d cache:           32K
L1i cache:           32K
L2 cache:            4096K
L3 cache:            16384K
NUMA node0 CPU(s):   0,1
Flags:               fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cm                                                       ov pat pse36 clflush mmx fxsr sse sse2 ss ht syscall nx pdpe1gb rdtscp lm consta                                                       nt_tsc arch_perfmon rep_good nopl xtopology cpuid tsc_known_freq pni pclmulqdq v                                                       mx ssse3 fma cx16 pdcm pcid sse4_1 sse4_2 x2apic movbe popcnt tsc_deadline_timer                                                        aes xsave avx f16c rdrand hypervisor lahf_lm abm 3dnowprefetch cpuid_fault invp                                                       cid_single ssbd ibrs ibpb stibp ibrs_enhanced tpr_shadow flexpriority ept vpid e                                                       pt_ad fsgsbase tsc_adjust bmi1 avx2 smep bmi2 erms invpcid avx512f avx512dq rdse                                                       ed adx smap avx512ifma clflushopt clwb avx512cd sha_ni avx512bw avx512vl xsaveop                                                       t xsavec xgetbv1 xsaves nt_good wbnoinvd arat vnmi avx512vbmi umip pku ospke avx                                                       512_vbmi2 gfni vaes vpclmulqdq avx512_vnni avx512_bitalg avx512_vpopcntdq la57 r                                                       dpid md_clear arch_capabilities

測試結果:

$ ./test.sh
real 135.08
user 134.69
sys 0.00
real 135.04
user 134.67
sys 0.00
real 135.14
user 134.67
sys 0.02
real 135.10
user 134.68
sys 0.00
real 135.06
user 134.69
sys 0.00

通過grep real|sed 's/real //'可以得到所有real time統計:

135.08
135.04
135.14
135.10
135.06

直接求平均值可以用grep real|sed 's/real //'|awk '{s+=$1} END {print s/5}', 因此平均值為135.084

Intel Xeon 6354

$ lscpu
Architecture:        x86_64
CPU op-mode(s):      32-bit, 64-bit
Byte Order:          Little Endian
CPU(s):              2
On-line CPU(s) list: 0,1
Thread(s) per core:  2
Core(s) per socket:  1
Socket(s):           1
NUMA node(s):        1
Vendor ID:           GenuineIntel
CPU family:          6
Model:               106
Model name:          Intel(R) Xeon(R) Gold 6354 CPU @ 3.00GHz
Stepping:            6
CPU MHz:             2993.064
BogoMIPS:            5986.12
Virtualization:      VT-x
Hypervisor vendor:   KVM
Virtualization type: full
L1d cache:           32K
L1i cache:           32K
L2 cache:            4096K
L3 cache:            16384K
NUMA node0 CPU(s):   0,1
Flags:               fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush mmx fxsr sse sse2 ss ht syscall nx pdpe1gb rdtscp lm constant_tsc arch_perfmon rep_good nopl xtopology cpuid tsc_known_freq pni pclmulqdq vmx ssse3 fma cx16 pdcm pcid sse4_1 sse4_2 x2apic movbe popcnt tsc_deadline_timer aes xsave avx f16c rdrand hypervisor lahf_lm abm 3dnowprefetch cpuid_fault invpcid_single ssbd ibrs ibpb stibp ibrs_enhanced tpr_shadow flexpriority ept vpid ept_ad fsgsbase tsc_adjust bmi1 avx2 smep bmi2 erms invpcid avx512f avx512dq rdseed adx smap avx512ifma clflushopt clwb avx512cd sha_ni avx512bw avx512vl xsaveopt xsavec xgetbv1 xsaves nt_good wbnoinvd arat vnmi avx512vbmi umip pku ospke avx512_vbmi2 gfni vaes vpclmulqdq avx512_vnni avx512_bitalg avx512_vpopcntdq la57 rdpid fsrm md_clear arch_capabilities

測試結果:

$ ./test.sh
real 123.69
user 123.40
sys 0.00
real 123.66
user 123.37
sys 0.00
real 123.65
user 123.38
sys 0.00
real 123.62
user 123.38
sys 0.00
real 123.63
user 123.38
sys 0.01

通過grep real|sed 's/real //'可以得到所有real time統計:

123.69
123.66
123.65
123.62
123.63

直接求平均值可以用grep real|sed 's/real //'|awk '{s+=$1} END {print s/5}', 因此平均值為123.65

AMD EPYC 7J13

$ ./test.sh
real 60.26
user 60.25
sys 0.00
real 60.51
user 60.50
sys 0.00
real 64.45
user 64.44
sys 0.00
real 67.76
user 66.29
sys 0.13
real 60.85
user 60.80
sys 0.00

測試結果:

$ ./test.sh
real 60.26
user 60.25
sys 0.00
real 60.51
user 60.50
sys 0.00
real 64.45
user 64.44
sys 0.00
real 67.76
user 66.29
sys 0.13
real 60.85
user 60.80
sys 0.00

通過grep real|sed 's/real //'可以得到所有real time統計:

60.26
60.51
64.45
67.76
60.85

直接求平均值可以用grep real|sed 's/real //'|awk '{s+=$1} END {print s/5}', 因此平均值為62.766

AMD EPYC 9J14

$ lscpu
Architecture:        x86_64
CPU op-mode(s):      32-bit, 64-bit
Byte Order:          Little Endian
CPU(s):              2
On-line CPU(s) list: 0,1
Thread(s) per core:  2
Core(s) per socket:  1
Socket(s):           1
NUMA node(s):        1
Vendor ID:           AuthenticAMD
CPU family:          25
Model:               17
Model name:          AMD EPYC 9J14 96-Core Processor
Stepping:            1
CPU MHz:             2596.100
BogoMIPS:            5192.20
Virtualization:      AMD-V
Hypervisor vendor:   KVM
Virtualization type: full
L1d cache:           64K
L1i cache:           64K
L2 cache:            512K
L3 cache:            16384K
NUMA node0 CPU(s):   0,1
Flags:               fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush mmx fxsr sse sse2 ht syscall nx mmxext fxsr_opt pdpe1gb rdtscp lm rep_good nopl cpuid extd_apicid tsc_known_freq pni pclmulqdq ssse3 fma cx16 pcid sse4_1 sse4_2 x2apic movbe popcnt tsc_deadline_timer aes xsave avx f16c rdrand hypervisor lahf_lm cmp_legacy svm cr8_legacy abm sse4a misalignsse 3dnowprefetch osvw topoext perfctr_core invpcid_single ssbd ibrs ibpb stibp vmmcall fsgsbase tsc_adjust bmi1 avx2 smep bmi2 erms invpcid avx512f avx512dq rdseed adx smap avx512ifma clflushopt clwb avx512cd sha_ni avx512bw avx512vl xsaveopt xsavec xgetbv1 xsaves nt_good avx512_bf16 clzero xsaveerptr wbnoinvd arat npt nrip_save avx512vbmi umip pku ospke avx512_vbmi2 gfni vaes vpclmulqdq avx512_vnni avx512_bitalg avx512_vpopcntdq la57 rdpid arch_capabilities

測試結果:

$ ./test.sh
real 52.63
user 52.62
sys 0.00
real 53.29
user 53.19
sys 0.00
real 52.13
user 52.12
sys 0.00
real 52.28
user 52.27
sys 0.00
real 55.77
user 54.79
sys 0.01

通過grep real|sed 's/real //'可以得到所有real time統計:

52.63
53.29
52.13
52.28
55.77

直接求平均值可以用grep real|sed 's/real //'|awk '{s+=$1} END {print s/5}', 因此平均值為53.22

Ampere Altra Q80-30

$ lscpu
Architecture:        aarch64
Byte Order:          Little Endian
CPU(s):              1
On-line CPU(s) list: 0
Thread(s) per core:  1
Core(s) per socket:  1
Socket(s):           1
NUMA node(s):        1
Vendor ID:           ARM
Model:               1
Model name:          Neoverse-N1
Stepping:            r3p1
BogoMIPS:            50.00
L1d cache:           unknown size
L1i cache:           unknown size
L2 cache:            unknown size
NUMA node0 CPU(s):   0
Flags:               fp asimd evtstrm aes pmull sha1 sha2 crc32 atomics fphp asimdhp cpuid asimdrdm lrcpc dcpop asimddp ssbs

測試結果:

$ ./test.sh
real 113.46
user 103.23
sys 0.23
real 103.77
user 103.02
sys 0.03
real 109.15
user 103.01
sys 0.14
real 105.11
user 103.29
sys 0.02
real 104.54
user 103.06
sys 0.02

通過grep real|sed 's/real //'可以得到所有real time統計:

113.46
103.77
109.15
105.11
104.54

直接求平均值可以用grep real|sed 's/real //'|awk '{s+=$1} END {print s/5}', 因此平均值為107.206

參考

  • https://docs.oracle.com/en-us/iaas/Content/Compute/References/computeshapes.htm#vm-standard

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/38186.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/38186.shtml
英文地址,請注明出處:http://en.pswp.cn/web/38186.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

搜索型數據庫的技術發展歷程與趨勢前瞻

概述 隨著數字科技的飛速發展和信息量的爆炸性增長&#xff0c;搜索引擎已成為我們獲取信息的首選途徑之一&#xff0c;典型的代表廠商如 Google。然而&#xff0c;隨著用戶需求的不斷演變&#xff0c;傳統的搜索技術已經無法滿足人們對信息的實時性、個性化和多樣性的需求。 …

Qt應用程序中通過上下左右鍵選擇控件,像win桌面圖標選擇一樣

在Qt應用程序中模擬Windows桌面圖標的選擇行為&#xff0c;即通過上下左右鍵來移動選擇控件&#xff0c;你需要管理一個焦點系統&#xff0c;該系統能夠跟蹤哪個控件當前被選中&#xff0c;并根據用戶的鍵盤輸入來更新這個狀態。以下是一個簡化的步驟說明和示例代碼&#xff0c…

華為OD機試(D卷+C卷+A卷+B卷)2024真題目錄(全、新、準)

目錄 專欄導讀華為OD機試算法題太多了&#xff0c;知識點繁雜&#xff0c;如何刷題更有效率呢&#xff1f; 一、邏輯分析二、數據結構1、線性表① 數組② 雙指針 2、map與list3、隊列4、鏈表5、棧6、滑動窗口7、二叉樹8、并查集9、矩陣 三、算法1、基礎算法① 貪心思維② 二分查…

Maven_構建和pom.xml

概述 Maven是為Java項目提供構建和依賴管理支持的工具 構建環節 清理clean 刪除上一次構建的結果 編譯compile Java源程序編譯成*.class字節碼文件 測試test 運行提前準備好的測試程序&#xff0c;執行src/text/java下的junit測試用例 報告site 每次測試后用標準格式記錄和…

射頻校準簡略

射頻電路功能的是否正常&#xff0c;在測試時就可發現&#xff0c;而怎么樣使測試的數據正確&#xff0c;對測試的儀器進行校準是必不可少的環節&#xff0c;校準的目的就是減少測試的誤差&#xff0c;使測試的儀器能夠準確的反映待測件的性能&#xff0c;在校準過程中&#xf…

react學習——20react編寫github案列

1、List組件 index.js import React, {Component} from "react"; //引入樣式 import "./index.css"; export default class List extends Component {render() {const {users,isFirst,isLoding,err}this.propsreturn(<div className"row">…

注意!!2024《信息系統監理師》易混淆知識點來了,趕緊收藏

寶子們&#xff0c;在復習軟考信息系統監理師中&#xff0c;是不是覺得有很多知識點含義比較相近&#xff0c;很多友友剛看的時候估計會像我一樣迷迷糊糊的&#xff0c;作為一個軟考老鳥&#xff0c;在這里給大家整理了信息系統監理師學習過程中易混淆的知識點&#xff0c;大家…

el-tree-transfer插件 入參說明

el-tree-transfer 是一個基于 Vue 和 Element-UI 的樹形穿梭框組件&#xff0c;用于實現左右兩側樹形結構數據的選擇與移動功能。以下是一些基本的入參說明&#xff0c;根據收集到的信息整理得出&#xff1a; title: 類型: Array默認值: [未選, 已選]說明: 穿梭框左右兩側的標題…

Redux 使用及基本原理

什么是Redux Redux 是用于js應用的狀態管理庫&#xff0c;通常和React一起用。幫助開發者管理應用中各個組件之間的狀態&#xff0c;使得狀態的變化變得更加可預測和易于調試。 Redu也可以不和React組合使用。&#xff08;通常一起使用&#xff09; Redux 三大原則 單一數據源…

武漢星起航:無錫跨境電商加速“出海”,物流升級助品牌全球布局

隨著全球化的不斷深入&#xff0c;跨境電商作為數字外貿的新業態&#xff0c;正逐漸成為無錫企業拓展海外市場的重要渠道。武漢星起航關注到&#xff0c;近年來&#xff0c;無錫市通過積極推進國際物流樞紐建設&#xff0c;完善海外倉布局&#xff0c;以及各特色產業帶的積極參…

2024 年江西省研究生數學建模競賽題目 A題交通信號燈管理--完整思路、代碼結果分享(僅供學習)

交通信號燈是指揮車輛通行的重要標志&#xff0c;由紅燈、綠燈、 黃燈組成。紅燈停、綠燈行&#xff0c;而黃燈則起到警示作用。交通 信號燈分為機動車信號燈、非機動車信號燈、人行橫道信號 燈、方向指示燈等。 一般情況下&#xff0c;十字路口有東西向和南北向 4 個方向的車…

SpringSecurity中文文檔(Servlet Session Management)

Authentication Persistence and Session Management 一旦您擁有了正在對請求進行身份驗證的應用程序&#xff0c;就必須考慮如何在將來的請求中持久化和恢復結果身份驗證。 默認情況下&#xff0c;這是自動完成的&#xff0c;因此不需要額外的代碼&#xff0c;盡管了解 requ…

手機歌曲怎么轉換成mp3格式,手機電腦都能輕松搞定

不同的手機和音樂應用可能支持不同的音頻格式&#xff0c;而MP3作為一種廣泛兼容的音頻格式&#xff0c;因其體積小、音質相對較好的特點&#xff0c;至今仍被廣泛使用。 如果您想將手機中的歌曲轉換成MP3格式&#xff0c;以便于在更多設備上播放或節省存儲空間&#xff0c;本…

iOS端授權頁添加自定義按鈕

如何添加自定義控件 基于一鍵登錄的拉起授權頁面功能&#xff0c;如果想要在我們的授權頁面中添加自定義組件&#xff0c;例如使用其他方式登錄的按鈕&#xff0c;來實現其他方式登錄功能&#xff0c;為用戶呈現更多選擇登錄的方式。本文介紹如何在一鍵登錄授權界面中實現添加…

機器學習之監督學習

整理一下機器學習中監督學習相關內容&#xff0c;爭取梳理出一條易于理解和掌握的脈絡。下面會有很多相關參考博客和文章&#xff0c;先放到一起&#xff0c;最后再做個整體的梳理。持續更新中。。。。。。 監督學習作為機器學習的核心分支&#xff0c;其理論體系與實踐應用都…

C# 警告 warning MSB3884: 無法找到規則集文件“MinimumRecommendedRules.ruleset”

警告 warning MSB3884: 無法找到規則集文件“MinimumRecommendedRules.ruleset” C:\Program Files\Microsoft Visual Studio\2022\Professional\MSBuild\Current\Bin\amd64\Microsoft.CSharp.CurrentVersion.targets(129,9): warning MSB3884: 無法找到規則集文件“MinimumRe…

競賽選題 python的搜索引擎系統設計與實現

0 前言 &#x1f525; 優質競賽項目系列&#xff0c;今天要分享的是 &#x1f6a9; python的搜索引擎系統設計與實現 &#x1f947;學長這里給一個題目綜合評分(每項滿分5分) 難度系數&#xff1a;3分工作量&#xff1a;5分創新點&#xff1a;3分 該項目較為新穎&#xff…

正則表達式在Java中的應用與實例

正則表達式在Java中的應用與實例 大家好&#xff0c;我是免費搭建查券返利機器人省錢賺傭金就用微賺淘客系統3.0的小編&#xff0c;也是冬天不穿秋褲&#xff0c;天冷也要風度的程序猿&#xff01; 正則表達式是一種強大的工具&#xff0c;用于模式匹配和字符串處理。在Java中…

武漢星起航:成功掛牌上股交,引領跨境電商行業進入全新發展階段

2023年10月30日&#xff0c;武漢星起航電子商務有限公司在上海股權托管交易中心成功掛牌展示&#xff0c;這一里程碑式的事件標志著武漢星起航正式登陸資本市場&#xff0c;開啟了公司發展的新篇章。作為亞馬遜跨境電商領域的領軍企業之一&#xff0c;武漢星起航此次掛牌不僅是…