維護一個交易系統,交易記錄表tradelog包含交易流水號(tradeid)、交易員id(operator)、交易時間(t_modified)等字段。
建表語句如下:
create table 'tradelog' ('id' int(11) not null,'tradeid' varchar(32) default null,'operator' int(11) default null,'t_modified' datetime default null,primary key ('id'),key 'tradeid' ('tradeid'),key 't_modified' ('t_modified')
) engine = InnoDB default charset = utf8mb4;
假設已經記錄了從2016年初到2018年底的所有數據,運營部門有一個需求:統計發生在所有年份中7月份的交易記錄總數。
我們可以這樣寫:
select count(*) from tradelog where month(t_modified) = 7;
t_modified字段上有索引,但是會發現這條語句執行時間特別久,才返回結果。
但是MySQL規定:如果對字段做了函數計算,就不能使用索引。
也就是說:
條件為where t_modified = '2018-7-1'
時,可以用上索引,而改成where month(t_modified) = 7
的時候就不行了。
B+樹同一層的兄弟節點是有序的,所以可以快速定位。
而當使用了month()函數,傳入7時,其實B+樹不知道接下來是取子節點還是兄弟節點。
所以說對索引字段做函數操作,優化器無法判斷最終的結果是不是有序的,所以就會放棄使用搜索樹,只能全部掃描該索引樹。所以建議在查詢時,盡量不要對字段進行操作
為了能夠用上索引的快速定位能力,我們就要把SQL語句改成基于字段本身的范圍查詢:
select count(*) from tradelog where-> (t_modified >= '2016-7-1' and t_modified < '2016-8-1') or-> (t_modified >= '2017-7-1' and t_modified < '2017-8-1') or-> (t_modified >= '2018-7-1' and t_modified < '2018-8-1');
優化器在對于不改變有序性的函數上,也不會考慮使用索引。比如:對于select * from tradelog where id + 1 = 10000這個SQL語句,
這個+1不會改變有序性,但是優化器還是不能用id索引快速定位到9999這一行。所以需要我們在寫SQL語句時,手動改寫成where id = 10000 - 1才行。