Mysql優化技巧

索引優化，查詢優化，查詢緩存，服務器設置優化，操作系統和硬件優化，應用層面優化（web服務器，緩存）等等。這里的記錄的優化技巧更適用于開發人員，都是從網絡上收集和自己整理的，主要是查詢語句上面的優化，其它層面的優化技巧在此不做記錄。

建立索引的幾個準則：

(1)、合理的建立索引能夠加速數據讀取效率，不合理的建立索引反而會拖慢數據庫的響應速度。

(2)、索引越多，更新數據的速度越慢。

(3)、盡量在采用MyIsam作為引擎的時候使用索引（因為MySQL以BTree存儲索引），而不是InnoDB。但MyISAM不支持Transcation。

(4)、當你的程序和數據庫結構/SQL語句已經優化到無法優化的程度，而程序瓶頸并不能順利解決，那就是應該考慮使用諸如memcached這樣的分布式緩存系統的時候了。

(5)、習慣和強迫自己用EXPLAIN來分析你SQL語句的性能。

1count的優化

比如：計算id大于5的城市

(1). select count(*) from world.city where id > 5;

(2). select (select count() from world.city) – count() from world.city where id <= 5;

a語句當行數超過11行的時候需要掃描的行數比b語句要多， b語句掃描了6行，此種情況下，b語句比a語句更有效率。當沒有where語句的時候直接select count(*) from world.city這樣會更快，因為mysql總是知道表的行數。

2避免使用不兼容的數據類型

例如float和int、char和varchar、binary和varbinary是不兼容的。數據類型的不兼容可能使優化器無法執行一些本來可以進行的優化操作。

在程序中，保證在實現功能的基礎上，盡量減少對數據庫的訪問次數；通過搜索參數，盡量減少對表的訪問行數,最小化結果集，從而減輕網絡負擔；能夠分開的操作盡量分開處理，提高每次的響應速度；在數據窗口使用SQL時，盡量把使用的索引放在選擇的首列；算法的結構盡量簡單；在查詢時，不要過多地使用通配符如 SELECT * FROM T1語句，要用到幾列就選擇幾列如：SELECT COL1,COL2 FROM T1；在可能的情況下盡量限制盡量結果集行數如：SELECT TOP 300 COL1,COL2,COL3 FROM T1,因為某些情況下用戶是不需要那么多的數據的。不要在應用中使用數據庫游標，游標是非常有用的工具，但比使用常規的、面向集的SQL語句需要更大的開銷；按照特定順序提取數據的查找。

3索引字段上進行運算會使索引失效

盡量避免在WHERE子句中對字段進行函數或表達式操作，這將導致引擎放棄使用索引而進行全表掃描。如：

SELECT * FROM T1 WHERE F1/2=100 應改為: SELECT * FROM T1 WHERE F1=100*2

4避免使用!=或＜＞、IS NULL或IS NOT NULL、IN ，NOT IN等這樣的操作符

因為這會使系統無法使用索引,而只能直接搜索表中的數據。例如: SELECT id FROM employee WHERE id != “B%” 優化器將無法通過索引來確定將要命中的行數,因此需要搜索該表的所有行。在in語句中能用exists語句代替的就用exists.

5盡量使用數字型字段

一部分開發人員和數據庫管理人員喜歡把包含數值信息的字段設計為字符型，這會降低查詢和連接的性能，并會增加存儲開銷。這是因為引擎在處理查詢和連接回逐個比較字符串中每一個字符，而對于數字型而言只需要比較一次就夠了。

6合理使用EXISTS,NOT EXISTS子句

如下所示：

(1). SELECT SUM(T1.C1) FROM T1 WHERE (SELECT COUNT(*)FROM T2 WHERE T2.C2=T1.C2>0)

(2). SELECT SUM(T1.C1) FROM T1WHERE EXISTS(SELECT * FROM T2 WHERE T2.C2=T1.C2)

兩者產生相同的結果，但是后者的效率顯然要高于前者。因為后者不會產生大量鎖定的表掃描或是索引掃描。如果你想校驗表里是否存在某條紀錄，不要用count(*)那樣效率很低，而且浪費服務器資源。可以用EXISTS代替。如：

IF (SELECT COUNT() FROM table_name WHERE column_name = ‘xxx’)可以寫成：IF EXISTS (SELECT FROM table_name WHERE column_name = ‘xxx’)

7能夠用BETWEEN的就不要用IN

8能夠用DISTINCT的就不用GROUP BY

9盡量不要用SELECT INTO語句。SELECT INTO 語句會導致表鎖定，阻止其他用戶訪問該表

10必要時強制查詢優化器使用某個索引

SELECT * FROM T1 WHERE nextprocess = 1 AND processid IN (8,32,45) 改成：

SELECT * FROM T1 (INDEX = IX_ProcessID) WHERE nextprocess = 1 AND processid IN (8,32,45)

則查詢優化器將會強行利用索引IX_ProcessID 執行查詢。

11消除對大型表行數據的順序存取

盡管在所有的檢查列上都有索引，但某些形式的WHERE子句強迫優化器使用順序存取。如：

SELECT * FROM orders WHERE (customer_num=104 AND order_num>1001) OR order_num=1008

解決辦法可以使用并集來避免順序存取：

SELECT * FROM orders WHERE customer_num=104 AND order_num>1001 UNION SELECT * FROM orders WHERE order_num=1008

這樣就能利用索引路徑處理查詢。【jacking 數據結果集很多，但查詢條件限定后結果集不大的情況下，后面的語句快】

12盡量避免在索引過的字符數據中，使用非打頭字母搜索。這也使得引擎無法利用索引

見如下例子：

SELECT * FROM T1 WHERE NAME LIKE ‘%L%’

SELECT * FROM T1 WHERE SUBSTING(NAME,2,1)=’L’

SELECT * FROM T1 WHERE NAME LIKE ‘L%’

即使NAME字段建有索引，前兩個查詢依然無法利用索引完成加快操作，引擎不得不對全表所有數據逐條操作來完成任務。而第三個查詢能夠使用索引來加快操作，不要習慣性的使用 ‘%L%’這種方式(會導致全表掃描)，如果可以使用`L%’相對來說更好;

13雖然UPDATE、DELETE語句的寫法基本固定，但是還是對UPDATE語句給點建議

(1). 盡量不要修改主鍵字段。

(2). 當修改VARCHAR型字段時，盡量使用相同長度內容的值代替。

(3). 盡量最小化對于含有UPDATE觸發器的表的UPDATE操作。

(4). 避免UPDATE將要復制到其他數據庫的列。

(5). 避免UPDATE建有很多索引的列。

(6). 避免UPDATE在WHERE子句條件中的列。

14能用UNION ALL就不要用UNION

UNION ALL不執行SELECT DISTINCT函數，這樣就會減少很多不必要的資源

在跨多個不同的數據庫時使用UNION是一個有趣的優化方法，UNION從兩個互不關聯的表中返回數據，這就意味著不會出現重復的行，同時也必須對數據進行排序，我們知道排序是非常耗費資源的，特別是對大表的排序。

UNION ALL可以大大加快速度，如果你已經知道你的數據不會包括重復行，或者你不在乎是否會出現重復的行，在這兩種情況下使用UNION ALL更適合。此外，還可以在應用程序邏輯中采用某些方法避免出現重復的行，這樣UNION ALL和UNION返回的結果都是一樣的，但UNION ALL不會進行排序。

15字段數據類型優化

(1). 避免使用NULL類型：NULL對于大多數數據庫都需要特殊處理，MySQL也不例外，它需要更多的代碼，更多的檢查和特殊的索引邏輯，有些開發人員完全沒有意識到，創建表時NULL是默認值，但大多數時候應該使用NOT NULL，或者使用一個特殊的值，如0，-1作為默認值。

(2). 盡可能使用更小的字段，MySQL從磁盤讀取數據后是存儲到內存中的，然后使用cpu周期和磁盤I/O讀取它，這意味著越小的數據類型占用的空間越小，從磁盤讀或打包到內存的效率都更好，但也不要太過執著減小數據類型，要是以后應用程序發生什么變化就沒有空間了。修改表將需要重構，間接地可能引起代碼的改變，這是很頭疼的問題，因此需要找到一個平衡點。

(3). 優先使用定長型