MySQL的索引是什么?怎么優化?

? ? ? ?索引類似大學圖書館建書目索引,可以提高數據檢索的效率,降低數據庫的IO成本。MySQL在300萬條記錄左右性能開始逐漸下降,雖然官方文檔說500~800w記錄,所以大數據量建立索引是非常有必要的。MySQL提供了Explain,用于顯示SQL執行的詳細信息,可以進行索引的優化。

一、導致SQL執行慢的原因:

?? ? ?1.硬件問題。如網絡速度慢,內存不足,I/O吞吐量小,磁盤空間滿了等。

?? ? ?2.沒有索引或者索引失效。(一般在互聯網公司,DBA會在半夜把表鎖了,重新建立一遍索引,因為當你刪除某個數據的時候,索引的樹結構就不完整了。所以互聯網公司的數據做的是假刪除.一是為了做數據分析,二是為了不破壞索引 )

?? ? ?3.數據過多(分庫分表)

?? ? ?4.服務器調優及各個參數設置(調整my.cnf)

二、分析原因時,一定要找切入點:

?? ? ?1.先觀察,開啟慢查詢日志,設置相應的閾值(比如超過3秒就是慢SQL),在生產環境跑上個一天過后,看看哪些SQL比較慢。

?? ? ?2.Explain和慢SQL分析。比如SQL語句寫的爛,索引沒有或失效,關聯查詢太多(有時候是設計缺陷或者不得以的需求)等等。

?? ? ?3.Show Profile是比Explain更近一步的執行細節,可以查詢到執行每一個SQL都干了什么事,這些事分別花了多少秒。

?? ? ?4.找DBA或者運維對MySQL進行服務器的參數調優。

三、什么是索引?

?? ? ?MySQL官方對索引的定義為:索引(Index)是幫助MySQL高效獲取數據的數據結構。我們可以簡單理解為:快速查找排好序的一種數據結構。Mysql索引主要有兩種結構:B+Tree索引和Hash索引。我們平常所說的索引,如果沒有特別指明,一般都是指B樹結構組織的索引(B+Tree索引)。索引如圖所示:

? ? ? ? ? ? ?

?? ? ?最外層淺藍色磁盤塊1里有數據17、35(深藍色)和指針P1、P2、P3(黃色)。P1指針表示小于17的磁盤塊,P2是在17-35之間,P3指向大于35的磁盤塊。真實數據存在于子葉節點也就是最底下的一層3、5、9、10、13......非葉子節點不存儲真實的數據,只存儲指引搜索方向的數據項,如17、35。

?? ? ?查找過程:例如搜索28數據項,首先加載磁盤塊1到內存中,發生一次I/O,用二分查找確定在P2指針。接著發現28在26和30之間,通過P2指針的地址加載磁盤塊3到內存,發生第二次I/O。用同樣的方式找到磁盤塊8,發生第三次I/O。

?? ? ?真實的情況是,上面3層的B+Tree可以表示上百萬的數據,上百萬的數據只發生了三次I/O而不是上百萬次I/O,時間提升是巨大的。

四、Explain分析

?? ? ?前文鋪墊完成,進入實操部分,先來插入測試需要的數據:

CREATE TABLE `user_info` (`id`   BIGINT(20)  NOT NULL AUTO_INCREMENT,`name` VARCHAR(50) NOT NULL DEFAULT '',`age`  INT(11)              DEFAULT NULL,PRIMARY KEY (`id`),KEY `name_index` (`name`)
)ENGINE = InnoDB DEFAULT CHARSET = utf8;INSERT INTO user_info (name, age) VALUES ('xys', 20);
INSERT INTO user_info (name, age) VALUES ('a', 21);
INSERT INTO user_info (name, age) VALUES ('b', 23);
INSERT INTO user_info (name, age) VALUES ('c', 50);
INSERT INTO user_info (name, age) VALUES ('d', 15);
INSERT INTO user_info (name, age) VALUES ('e', 20);
INSERT INTO user_info (name, age) VALUES ('f', 21);
INSERT INTO user_info (name, age) VALUES ('g', 23);
INSERT INTO user_info (name, age) VALUES ('h', 50);
INSERT INTO user_info (name, age) VALUES ('i', 15);CREATE TABLE `order_info` (`id`           BIGINT(20)  NOT NULL AUTO_INCREMENT,`user_id`      BIGINT(20)           DEFAULT NULL,`product_name` VARCHAR(50) NOT NULL DEFAULT '',`productor`    VARCHAR(30)          DEFAULT NULL,PRIMARY KEY (`id`),KEY `user_product_detail_index` (`user_id`, `product_name`, `productor`)
)ENGINE = InnoDB DEFAULT CHARSET = utf8;INSERT INTO order_info (user_id, product_name, productor) VALUES (1, 'p1', 'WHH');
INSERT INTO order_info (user_id, product_name, productor) VALUES (1, 'p2', 'WL');
INSERT INTO order_info (user_id, product_name, productor) VALUES (1, 'p1', 'DX');
INSERT INTO order_info (user_id, product_name, productor) VALUES (2, 'p1', 'WHH');
INSERT INTO order_info (user_id, product_name, productor) VALUES (2, 'p5', 'WL');
INSERT INTO order_info (user_id, product_name, productor) VALUES (3, 'p3', 'MA');
INSERT INTO order_info (user_id, product_name, productor) VALUES (4, 'p1', 'WHH');
INSERT INTO order_info (user_id, product_name, productor) VALUES (6, 'p1', 'WHH');
INSERT INTO order_info (user_id, product_name, productor) VALUES (9, 'p8', 'TE');

初體驗,執行Explain的效果:

索引使用情況在possible_keys、key和key_len三列,接下來我們先從左到右依次講解。

1.id

--id相同,執行順序由上而下
explain select u.*,o.* from user_info u,order_info o where u.id=o.user_id;

--id不同,值越大越先被執行
explain select * from  user_info  where id=(select user_id from order_info where  product_name ='p8');

2.select_type

可以看id的執行實例,總共有以下幾種類型:

  • SIMPLE:?表示此查詢不包含 UNION 查詢或子查詢
  • PRIMARY:?表示此查詢是最外層的查詢
  • SUBQUERY:?子查詢中的第一個 SELECT
  • UNION:?表示此查詢是 UNION 的第二或隨后的查詢
  • DEPENDENT UNION:?UNION 中的第二個或后面的查詢語句, 取決于外面的查詢
  • UNION RESULT, UNION 的結果
  • DEPENDENT SUBQUERY: 子查詢中的第一個 SELECT, 取決于外面的查詢. 即子查詢依賴于外層查詢的結果.
  • DERIVED:衍生,表示導出表的SELECT(FROM子句的子查詢)

3.table

table表示查詢涉及的表或衍生的表:

explain select tt.* from (select u.* from user_info u,order_info o where u.id=o.user_id and u.id=1) tt

id為1的<derived2>的表示id為2的u和o表衍生出來的。

4.type

type 字段比較重要,它提供了判斷查詢是否高效的重要依據依據。 通過 type 字段,我們判斷此次查詢是 全表掃描 還是 索引掃描等。


type 常用的取值有:

  • system: 表中只有一條數據,?這個類型是特殊的 const 類型。
  • const: 針對主鍵或唯一索引的等值查詢掃描,最多只返回一行數據。 const 查詢速度非常快, 因為它僅僅讀取一次即可。例如下面的這個查詢,它使用了主鍵索引,因此 type 就是 const 類型的:explain select * from user_info where id = 2;
  • eq_ref: 此類型通常出現在多表的 join 查詢,表示對于前表的每一個結果,都只能匹配到后表的一行結果。并且查詢的比較操作通常是 =,查詢效率較高。例如:explain select * from user_info, order_info where user_info.id = order_info.user_id;
  • ref: 此類型通常出現在多表的 join 查詢,針對于非唯一或非主鍵索引,或者是使用了 最左前綴 規則索引的查詢。例如下面這個例子中, 就使用到了 ref 類型的查詢:explain select * from user_info, order_info where user_info.id = order_info.user_id AND order_info.user_id = 5
  • range: 表示使用索引范圍查詢,通過索引字段范圍獲取表中部分數據記錄。這個類型通常出現在 =, <>, >, >=, <, <=, IS NULL, <=>, BETWEEN, IN() 操作中。例如下面的例子就是一個范圍查詢:explain select * from user_info ?where id between 2 and 8;
  • index: 表示全索引掃描(full index scan),和 ALL 類型類似,只不過 ALL 類型是全表掃描,而 index 類型則僅僅掃描所有的索引, 而不掃描數據。index 類型通常出現在:所要查詢的數據直接在索引樹中就可以獲取到, 而不需要掃描數據。當是這種情況時,Extra 字段 會顯示 Using index。
  • ALL: 表示全表掃描,這個類型的查詢是性能最差的查詢之一。通常來說, 我們的查詢不應該出現 ALL 類型的查詢,因為這樣的查詢在數據量大的情況下,對數據庫的性能是巨大的災難。 如一個查詢是 ALL 類型查詢, 那么一般來說可以對相應的字段添加索引來避免。

?? ? ?通常來說, 不同的 type 類型的性能關系如下:
?? ? ?ALL < index < range ~ index_merge < ref < eq_ref < const < system
?? ? ?ALL 類型因為是全表掃描, 因此在相同的查詢條件下,它是速度最慢的。而 index 類型的查詢雖然不是全表掃描,但是它掃描了所有的索引,因此比 ALL 類型的稍快.后面的幾種類型都是利用了索引來查詢數據,因此可以過濾部分或大部分數據,因此查詢效率就比較高了。

5.possible_keys

?? ? ?它表示 mysql 在查詢時,可能使用到的索引。 注意,即使有些索引在 possible_keys 中出現,但是并不表示此索引會真正地被 mysql 使用到。?mysql 在查詢時具體使用了哪些索引,由 key 字段決定。

6.key

?? ? ?此字段是 mysql 在當前查詢時所真正使用到的索引。比如請客吃飯,possible_keys是應到多少人,key是實到多少人。當我們沒有建立索引時:

explain select o.* from order_info o where  o.product_name= 'p1' and  o.productor='whh';
create index idx_name_productor on order_info(productor);
drop index idx_name_productor on order_info;

建立復合索引后再查詢:

7.key_len

?? ? ?表示查詢優化器使用了索引的字節數,這個字段可以評估組合索引是否完全被使用。

8.ref

?? ? ?這個表示顯示索引的哪一列被使用了,如果可能的話,是一個常量。前文的type屬性里也有ref,注意區別。

9.rows

?? ? ?rows 也是一個重要的字段,mysql 查詢優化器根據統計信息,估算 sql 要查找到結果集需要掃描讀取的數據行數,這個值非常直觀的顯示 sql 效率好壞, 原則上 rows 越少越好。可以對比key中的例子,一個沒建立索引錢,rows是9,建立索引后,rows是4。

10.extra

explain 中的很多額外的信息會在 extra 字段顯示, 常見的有以下幾種內容:

  • using filesort :表示 mysql 需額外的排序操作,不能通過索引順序達到排序效果。一般有 using filesort都建議優化去掉,因為這樣的查詢 cpu 資源消耗大。
  • using index:覆蓋索引掃描,表示查詢在索引樹中就可查找所需數據,不用掃描表數據文件,往往說明性能不錯。
  • using temporary:查詢有使用臨時表, 一般出現于排序, 分組和多表 join 的情況, 查詢效率不高,建議優化。
  • using where :表名使用了where過濾。

五、優化案例

explain select u.*,o.* from user_info u LEFT JOIN  order_info o on u.id=o.user_id;

執行結果,type有ALL,并且沒有索引:

開始優化,在關聯列上創建索引,明顯看到type列的ALL變成ref,并且用到了索引,rows也從掃描9行變成了1行:

這里面一般有個規律是:左鏈接索引加在右表上面,右鏈接索引加在左表上面。

六、是否需要創建索引?? ?

?? ? ?索引雖然能非常高效的提高查詢速度,同時卻會降低更新表的速度。實際上索引也是一張表,該表保存了主鍵與索引字段,并指向實體表的記錄,所以索引列也是要占用空間的。

? ? ? ? ? ? ??

轉自:https://my.oschina.net/liughDevelop/blog/1788148

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/443287.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/443287.shtml
英文地址,請注明出處:http://en.pswp.cn/news/443287.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

通達信板塊監控指標_通達信洞察強勢板塊指標公式

N:13;P:4;RN:27;VVAR1:(MA(CLOSE,80)-MA(CLOSE,13)/3);VVAR2:( MA((CLOSE-VVAR1)/VVAR1,1));VVAR3:(CLOSE-LLV(LOW,28))/(HHV(HIGH,28)-LLV(LOW,28))*100;VVAR4:SMA(VVAR3,4,1);MMA:EMA(VVAR2,12)*0.7;MMB:EMA(VVAR2,3);快到底:IF(LLV(MMB-MMA,12)>0,0,-20),LINETHICK2,COLO…

12306能刪候補訂單記錄_12306候補購票功能在哪里怎么用 火車票候補購票使用攻略...

12月27日&#xff0c;12306火車票官方推出了一個「候補購票」功能&#xff0c;目前已經開啟春運試點&#xff0c;對于購買火車票的用戶來說&#xff0c;當沒票可買的時候&#xff0c;可以提交候補購票&#xff0c;又多了一種購票途徑了。不過&#xff0c;很多小伙伴對于候補購票…

GIT提交message規范

<type>(<scope>): <subject> <body> <footer> # type 用于說明 commit 的類別&#xff0c;只允許使用下面7個標識。 feat: 新功能&#xff08;feature&#xff09; fix: 修補bug docs: 文檔&#xff08;documentation&#xff09; style: 格…

git實現審核功能_一文教你如何搭建PDD分傭小程序實現財富自由

隨著拼多多的火爆&#xff0c;很多淘客以各種方式通過推廣拼多多商品獲取返傭來月入萬元&#xff0c;實現財富自由。只要你有流量或者足夠努力&#xff0c;像其他淘客一樣實現睡后過萬財富自由不是夢。本文通過詳細教程教你快速搭建屬于自己的PDD分傭小程序&#xff0c;完成自己…

9型轉x型 cobol_蘭州一餐館推鴛鴦牛肉面 9種面型一面多吃

來源標題&#xff1a;蘭州一餐館推鴛鴦牛肉面&#xff0c;清湯酸菜各一邊還有9種面型&#xff0c;網友&#xff1a;能連吃三碗近日&#xff0c;位于甘肅蘭州的一家牛肉面館推出了鴛鴦牛肉面。一個大碗分隔為兩邊&#xff0c;一邊是傳統清湯牛肉面&#xff0c;另一邊是酸菜牛肉面…

gitignore不起作用

.gitignore中已經標明忽略的文件目錄下的文件&#xff0c;git push的時候還會出現在push的目錄中&#xff0c;原因是因為在git忽略目錄中&#xff0c;新建的文件在git中會有緩存&#xff0c;如果某些文件已經被納入了版本管理中&#xff0c;就算是在.gitignore中已經聲明了忽略…

java填空題 在非靜態成員方法中_成本加成定價法的優點有

【單選題】以下Math類的方法中,-4.4通過哪個方法運算后,結果為-5.0?【填空題】以下程序的輸出結果為?【單選題】下列方法定義中,正確的是()【判斷題】Java 中被 final 關鍵字修飾的變量,不能被重新賦值。【簡答題】請按以下要求編寫程序 (1) 創建一個Rectangle類,添加width和…

【算法系列之十三】二叉樹兩葉節點的最大距離

1、題目描述 給定一棵二叉樹&#xff0c;計算這課二叉樹的直徑長度&#xff0c;即為二叉樹任意兩個節點間的最長路徑。比如&#xff1a; 這棵二叉樹的最長路徑為3。 2、解題思路 使用遞歸進行求解&#xff0c;每次遞歸的過程中&#xff0c;先求出以某個節點為樹根的二…

date比較大小 mybatis_Hibernate 和 MyBatis 哪個更好用?

Java大聯盟幫助萬千Java學習者持續成長關注作者&#xff5c;SylvanasSun鄭沐興https://zhuanlan.zhihu.com/p/21966051B 站搜索&#xff1a;楠哥教你學Java獲取更多優質視頻教程前言由于編程思想與數據庫的設計模式不同&#xff0c;生出了一些ORM框架。核心都是將關系型數據庫和…

簡單的cpu飆升排查方法

1先來一段飆升代碼 public class FindJavaThreadInTaskManager {public static void main(String[] args) {Thread thread new Thread(new Worker());thread.start();}static class Worker implements Runnable {Overridepublic void run() {while (true) {System.out.printl…

tortoisesvn創建部署項目_FrameWork如何進行云托管部署

介紹CloudBase Framework 是云開發官方出品的云原生一體化部署工具&#xff0c;可以幫助開發者將靜態網站、后端服務和小程序等應用&#xff0c;一鍵部署到云開發 Serverless 架構的云平臺上&#xff0c;自動伸縮且無需關心運維&#xff0c;聚焦應用本身&#xff0c;無需關心底…

【算法系列之十四】最大子序和

1、題目描述 給定一個整數數組 nums &#xff0c;找到一個具有最大和的連續子數組&#xff08;子數組最少包含一個元素&#xff09;&#xff0c;返回其最大和。 示例: 輸入: [-2,1,-3,4,-1,2,1,-5,4], 輸出: 6 解釋: 連續子數組 [4,-1,2,1] 的和最大&#xff0c;為 6。 2、…

python的代碼復用技術_Python__函數和代碼復用

主要內容函數的定義和使用實例:七段數碼管的繪制代碼復用與函數遞歸PyInstall庫的使用實例&#xff1a;科赫雪花小包裹函數的定義與使用函數的理解與定義函數的使用及調用過程函數的參數傳遞函數的返回值局部變量和全局變量lambda函數------------------------------------函數…

Queue:poll、offer、element、peek的區別

隊列是一種特殊的線性表&#xff0c;它只允許在表的前端&#xff08;front&#xff09;進行刪除操作&#xff0c;而在表的后端&#xff08;rear&#xff09;進行插入操作。進行插入操作的端稱為隊尾&#xff0c;進行刪除操作的端稱為隊頭。隊列中沒有元素時&#xff0c;稱為空隊…

python實現k均值算法_python實現kMeans算法

聚類是一種無監督的學習&#xff0c;將相似的對象放到同一簇中&#xff0c;有點像是全自動分類&#xff0c;簇內的對象越相似&#xff0c;簇間的對象差別越大&#xff0c;則聚類效果越好。1、k均值聚類算法k均值聚類將數據分為k個簇&#xff0c;每個簇通過其質心&#xff0c;即…

mysql給數據量大的表添加索引的辦法

有一個問題&#xff0c;一張表有3百萬條記錄&#xff0c;隨著時間的增加&#xff0c;記錄量會更多&#xff0c;此時查詢速度很慢。在創建此表前沒有未相應字段添加索引&#xff0c;所以此時需要為表添加索引。但是因為數據量大的原因&#xff0c;索引添加不成功&#xff0c;想了…

修改背景圖片_我花了5小時,為網易修改了一份內容超多的PPT,效果超級贊!!...

微信掃碼觀看全套Excel、Word、PPT視頻作者&#xff1a;宋雪賢 來源&#xff1a;PPT進化論(ID&#xff1a;PPTjinhualun)哈嘍&#xff0c;大家好&#xff0c;不知道您看過《我花了3個小時&#xff0c;為京東修改了一份PPT&#xff0c;效果好到驚人&#xff01;》這篇案例修改文…

MySQL千萬級別大表如何優化?

當MySQL單表記錄數過大時&#xff0c;增刪改查性能都會急劇下降&#xff0c;可以參考以下步驟來優化&#xff1a; 單表優化 除非單表數據未來會一直不斷上漲&#xff0c;否則不要一開始就考慮拆分&#xff0c;拆分會帶來邏輯、部署、運維的各種復雜度&#xff0c;一般以整型值…

linux c 調用python_C程序調用Python腳本

一般調用步驟Py_Initialize(); //初始化Python環境PyImport_ImportModule("test"); // 載入python模塊PyObject_GetAttrString(g_pModule,"test1"); //獲得相應Python函數的PyObjectPyObject_CallFunction(test1,"i,s",2,e); //調用Python相應的…

命令測試post_【第2088期】前端中臺化,把格局做大——NodeJS 和測試服務探索

前言今日早讀文章由《React狀態管理與同構實戰》作者LucasHC投稿分享。正文從這開始~~近些年&#xff0c;「NodeJS 應該如何在公司業務中真實落地 」這類問題屢見不鮮。自從 2009 年 NodeJS 誕生之后&#xff0c;搶盡風頭&#xff0c;圈粉無數。但一定有工程師不禁要質疑「Node…