分享一波:程序員賺外快-必看的巔峰干貨
前言
前段時間關于統計數量的sql問題和朋友進行了討論,網上關于這三種查詢方式說法不一,主要有以下兩種說法。
count(*) = count(主鍵) > count(1)
count(主鍵) > count(*) > count(1)
今天對這三種方式進行探究。
數據庫為mysql 5.7.12,引擎為InnoDB。
建表
CREATE TABLE user
(
id
int(32) NOT NULL AUTO_INCREMENT,
name
varchar(500) DEFAULT NULL COMMENT ‘姓名’,
deleted
int(2) NOT NULL DEFAULT ‘1’ COMMENT ‘邏輯刪除’,
created_date
datetime DEFAULT NULL COMMENT ‘創建時間’,
created_by
varchar(255) DEFAULT NULL,
update_date
datetime DEFAULT NULL,
update_by
varchar(255) DEFAULT NULL,
version
int(11) NOT NULL DEFAULT ‘1’ COMMENT ‘樂觀鎖’,
PRIMARY KEY (id
) USING BTREE
) ENGINE=InnoDB AUTO_INCREMENT=1502726 DEFAULT CHARSET=utf8 ROW_FORMAT=COMPACT COMMENT=‘用戶表’;
循環插入150萬條數據。
DROP PROCEDURE
IF
EXISTS proc_initData;
DELIMITER $
CREATE PROCEDURE proc_initData () BEGIN
DECLARE
i INT DEFAULT 1;
WHILE
i <= 5000000 DO
INSERT INTO user ( name, created_date, update_date )
VALUES
( ‘哈哈哈啊哈哈哈’, NOW(), NOW() );
SET i = i + 1;END WHILE;
END $ CALL proc_initData ();
這里需要使用到mysql的explain關鍵字,對count(1),count(*),count(id),count(name)分別查看性能
explain select count(1) from user
explain select count(*) from user
explain select count(id) from user
explain select count(name) from user
可以看出,select count(1)、count(*)、count(id)的執行計劃是一毛一樣的。多次執行取平均值,三者的性能也是非常趨近,因此可以認為三者性能相同。這里我加了個count(name)進行對比,并將最后30萬條數據的name置空,可以看出性能有明顯的差別。
mysql底層對count查詢做了優化,當mysql確定count中的列名不為空時,實際上就是在統計行數。那么mysql內部會將count(列名)優化為count(*) —— 出自《高性能MySQL》一書
也就是說count(1)和count(主鍵字段)還是要優化到count()的,而如果只是統計某個列,只要該列不為空,無論是否為索引,都會被優化為count(),因此三者性能并無任何差異。官方文檔對其也進行了解釋。
InnoDB handles SELECT COUNT(*) and SELECT COUNT(1) operations in the same way. There is no performance difference.
https://dev.mysql.com/doc/refman/5.7/en/group-by-functions.html#function_count
至此,事實上并未解決關于這個問題的疑惑。上面的內容都在強調“Mysql”,就是說,上面的驗證可能僅對MySql有效,其他的數據庫可能未必會對count語句進行優化。因此我又通過SQLServer去驗證。
因為我本地并沒有安裝SQLServer,因此我是直接使用公司的開發庫進行驗證,這里不方便截圖,直接說明一下200萬條數據驗證結果。
列名為主鍵,count(列名)會比count(1)快
列名不為主鍵,count(1)會比count(列名)快
如果表多個列并且沒有主鍵,則 count(1) 的執行效率優于 count(*)
如果有主鍵,則 select count(主鍵)的執行效率是最優的
如果表只有一個字段,則 select count(*)最優。
可見,在SQLServer中,count(*)的性能并沒有count(主鍵)高。
結語
根據上面對兩個數據庫的驗證得出結論:不說是什么數據庫都是耍流氓!SQL標準只提供了count這個內置函數,所有的數據庫需要遵循這個標準,但是不同的數據庫對于count的處理不同。在mysql中建議寫count(*),而在SQLServer中建議寫count(主鍵),在PostgreSql以及其他數據庫中并未對其進行驗證
分享一波:程序員賺外快-必看的巔峰干貨
如果以上內容對你覺得有用,并想獲取更多的賺錢方式和免費的技術教程
請關注微信公眾號:HB荷包
一個能讓你學習技術和賺錢方法的公眾號,持續更新