前言
當mysql CPU告警利用率過高的時候,我們應該怎么定位是哪些SQL導致的呢,本文將介紹一下定位的方法。
本文所使用的方法,前提是你可以登錄到Mysql所在的服務器,執行命令查看進程,當然讓數據庫管理員登錄執行也可以。但如果無法或無權限去服務器上執行命令,本方法將不適合定位問題。
一.獲取Mysql的服務器進程號
登陸mysql所在的Linux服務器,執行命令:top
,在COMMAND
列找到mysqld
,并且%CPU
使用率高的,比如數值超過100的,獲取PID
號。
PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
32232 root 20 0 1443252 356688 11748 S 107.0 4.4 2:03.82 mysqld
上述例子中,32232
為mysql
進程ID,接下來再用它查詢出占用CPU多的線程。
二.查詢進程中的線程
使用命令:top -H -p <mysqld 進程 id>
,查詢線程號:
本例中使用命令top -H -p 32232
PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
32272 root 20 0 1443252 356688 11748 R 99.7 4.4 2:25.74 mysqld
其中PID 32272
為線程id號。
三.根據線程ID去mysql查詢出對應的SQL
select a.user,a.host,a.db,b.thread_os_id,b.thread_id,a.id processlist_id,a.command,a.time,a.state,a.info from information_schema.processlist a,performance_schema.threads b where a.id = b.processlist_id and b.thread_os_id=32272;
查詢結果:
| user | host | db | thread_os_id | thread_id | processlist_id | command | time | state | info |
+----------+-----------+------+--------------+-----------+----------------+---------+------+--------------+---------------------------------------------+
| msandbox | localhost | test | 32272 | 32 | 7 | Query | 2 | Sending data | select * from t_abc order by rand() limit 1 |
+----------+-----------+------+--------------+-----------+----------------+---------+------+--------------+---------------------------------------------+
其中,info
列顯示的SQL就是占用CPU較大的SQL,針對其進行優化即可。
此外,還可以通過下列SQL,查詢下線程的其他信息,方便進一步優化:
select * from performance_schema.events_statements_current where thread_id in (select thread_id from performance_schema.threads where thread_os_id = 32272)
通過這個結果我們可以查看具體的 SQL,看到有使用臨時表、使用了排序等信息。
查詢結果節選:
CREATED_TMP_DISK_TABLES: 1
CREATED_TMP_TABLES: 1
SORT_ROWS: 1
SORT_SCAN: 1
總結:
本文介紹了一種登陸Mysql服務器,定位CPU利用率過高的SQL的方法,可以使用此方法,快速的定位到正在數據庫里抽大煙的SQL,kill掉進程,并且優化SQL后即可解決。此方法一定要在CPU告警時使用,如果CPU已經恢復正常了,則無法使用此方法查詢了。喜歡本文請點贊收藏。