SQL詳細語法教程（七）核心優化

以下對?SQL 優化?涉及的關鍵場景（含?update?行鎖優化）進行極致詳細的拆解，從底層原理、執行流程到實戰代碼、避坑指南全維度覆蓋，搭配表格對比讓邏輯更清晰：

一、SQL 優化 - COUNT 優化

1. 底層原理：`COUNT()`?的執行邏輯本質

COUNT()?是?“統計符合條件的非 NULL 行數”，但不同寫法會觸發數據庫不同的執行路徑，核心差異在于?“是否利用索引”?和?“如何處理 NULL 值”。

2. 細分場景對比（含執行流程、性能、適用場景）

語法寫法	執行流程拆解（以 InnoDB 為例）	性能關鍵影響點	適用場景	極端案例對比（1000 萬行表）
`COUNT(*)`	1. 選最窄索引（如主鍵索引、普通索引） 2. 遍歷索引樹，統計 “非刪除標記” 的葉子節點數 3. 無需回表（因索引已記錄行數邏輯）	無需判 NULL，依賴優化器選最優索引	全表 / 條件總行數統計	耗時～100ms（走索引）
`COUNT(1)`	與?`COUNT(*)`?邏輯幾乎等價，數據庫將?`1`?視為 “常量”，同樣走索引統計	與?`COUNT(*)`?性能無差異（語法糖）	習慣寫法，兼容所有場景	耗時～100ms（同?`COUNT(*)`）
`COUNT(主鍵)`	1. 遍歷主鍵索引樹（聚簇索引） 2. 統計主鍵非 NULL 的行數（主鍵本身非 NULL，所以等價全表行統計）	主鍵必須存在，否則退化為全表掃描	主鍵明確且需精準統計時	耗時～120ms（主鍵索引稍寬）
`COUNT(普通列)`	1. 遍歷普通索引（若列無索引則全表掃描） 2. 逐行判斷列值是否為 NULL，非 NULL 才計數 3. 若列有 NULL，需回表確認行狀態	需判 NULL + 可能回表，性能極差	絕對禁止使用	耗時～10s（全表掃 + 判空）

3. 實戰優化：從反例到正例

-- 反例 1：用 COUNT(name)，name 可能為 NULL，且無索引時全表掃
-- 執行流程：全表掃描每一行 → 判 name 是否為 NULL → 統計非 NULL 值
SELECT COUNT(name) FROM t_user; -- 正例 1：全表行數統計，讓優化器自動選最窄索引（如 idx_status）
SELECT COUNT(*) FROM t_user; -- 反例 2：帶條件但無索引，觸發全表掃
SELECT COUNT(*) FROM t_user WHERE age > 18; -- 正例 2：給 age 加索引，讓數據庫走索引樹統計（無需回表）
CREATE INDEX idx_age ON t_user(age); 
SELECT COUNT(*) FROM t_user WHERE age > 18; -- 進階優化：高頻統計“某狀態行數”，用冗余字段/單獨表存儲
-- 場景：需實時統計 status=1 的行數，直接查冗余字段
ALTER TABLE t_user ADD COLUMN status_count INT DEFAULT 0; 
-- 插入/更新時維護 status_count，查詢時直接 SELECT status_count FROM t_user WHERE status=1;

二、SQL 優化 - 插入數據優化

1. 插入性能瓶頸：從磁盤 IO 到索引維護

插入操作的核心消耗是?“寫數據頁”?和?“維護索引”，具體流程：

事務日志（Redo Log）：插入前先寫日志（確保崩潰恢復），磁盤隨機 IO 是瓶頸。
數據頁寫入：數據寫入內存頁，若頁未滿需等待（或觸發頁分裂）。
索引維護：每條數據需更新所有索引樹（如主鍵索引、普通索引），索引越多，耗時越久。

2. 細分場景優化（含代碼示例、參數調整）

插入場景	核心問題	優化手段	代碼示例 / 參數調整
單行插入（高頻）	事務提交次數多，日志刷盤頻繁	批量插入 + 調整事務提交策略	```sql
-- 反例：單行插入（100 次事務）
INSERT INTO t_log (user_id, content) VALUES (1, 'a');
-- 正例：批量插入（1 次事務）
INSERT INTO t_log (user_id, content) VALUES (1, 'a'), (2, 'b'), ..., (1000, 'z');
``` MySQL 調整：`SET autocommit = 0;`（關閉自動提交）	從 10s → 1s 左右
高并發插入	自增主鍵鎖競爭（AUTO_INCREMENT 鎖）	用分布式 ID 或調整自增鎖模式	```sql
-- 方案 1：雪花算法生成主鍵（Java 示例）
Long id = SnowflakeIdGenerator.nextId();
INSERT INTO t_order (id, user_id) VALUES (id, 123);
-- 方案 2：MySQL 調整自增鎖模式（適合批量插入）
SET GLOBAL innodb_autoinc_lock_mode = 2; -- 異步分配自增 ID

| 索引過多插入      | 索引維護耗時占比高（如 5 個索引）  | 先刪索引，插入后重建              | ```sql
-- 步驟 1：刪除索引
DROP INDEX idx_user ON t_order; 
DROP INDEX idx_create_time ON t_order; 
-- 步驟 2：批量插入（無索引維護開銷）
INSERT INTO t_order (...) VALUES (...); 
-- 步驟 3：重建索引
CREATE INDEX idx_user ON t_order(user_id); 
CREATE INDEX idx_create_time ON t_order(create_time); 
``` | 插入耗時從 30s → 5s        |  #### 3. 極端場景：冷熱數據分離插入  
```sql
-- 問題：歷史表（如 3 年前的訂單）插入時，因數據頁分散，插入慢
-- 優化：分區表+按時間分區，插入時直接定位到“熱分區”
ALTER TABLE t_order PARTITION BY RANGE (TO_DAYS(create_time)) (PARTITION p2023 VALUES LESS THAN (TO_DAYS('2024-01-01')),PARTITION p2024 VALUES LESS THAN (TO_DAYS('2025-01-01')),PARTITION p2025 VALUES LESS THAN (MAXVALUE)
); 
-- 插入時自動路由到對應分區，減少數據頁碎片影響
INSERT INTO t_order (create_time, ...) VALUES ('2024-06-01', ...); -- 走 p2024 分區

三、SQL 優化 - 主鍵優化

1. 主鍵設計的核心矛盾：“唯一性” vs “插入性能” vs “索引緊湊性”

主鍵是表的 “根索引”（InnoDB 聚簇索引），其設計直接影響?插入順序性（是否導致頁分裂）和?查詢效率（索引樹高度）。

2. 主鍵類型對比（含底層存儲、優缺點、適用場景）

主鍵方案	底層存儲特點（InnoDB）	優點	缺點	適用場景	極端案例（10 億數據）
自增主鍵（INT）	數據頁順序寫入，索引樹緊湊（類似數組 append）	插入性能高，索引樹高度低（查詢快）	高并發下自增鎖可能成為瓶頸	中小規模業務、讀多寫少	主鍵占 4B，索引樹高度～3（快）
分布式 ID（雪花算法）	主鍵隨機不連續，但全局唯一（如 64 位 Long）	無鎖競爭，支持超高并發插入	索引樹碎片化（隨機寫導致頁分裂）	海量數據、高并發寫入場景	主鍵占 8B，索引樹高度～4（稍慢）
UUID 主鍵	主鍵完全隨機（128 位字符串）	全局唯一，無需依賴數據庫	索引樹碎片化嚴重（插入性能暴跌）	絕對禁止使用	主鍵占 36B，索引樹高度～5（極慢）

3. 主鍵優化實操（解決索引碎片、鎖競爭）

-- 問題 1：刪除+插入頻繁，主鍵索引碎片化（查詢變慢）
-- 步驟 1：查看索引碎片率（MySQL）
SELECT TABLE_NAME, INDEX_NAME, INDEX_TYPE, DATA_FREE -- 碎片大小
FROM INFORMATION_SCHEMA.STATISTICS 
WHERE TABLE_SCHEMA = 'test_db' AND TABLE_NAME = 't_user'; -- 步驟 2：整理碎片（InnoDB 會重建聚簇索引）
OPTIMIZE TABLE t_user; -- 步驟 3：重建后查看碎片（DATA_FREE 大幅減少）
SELECT ...（同上）; -- 問題 2：自增主鍵高并發鎖競爭
-- 方案：調整自增鎖模式（MySQL 8.0+）
SET GLOBAL innodb_autoinc_lock_mode = 2; -- 異步分配自增 ID，減少鎖等待
-- 注意：需確保 binlog 格式為 ROW（避免主從同步問題）

四、SQL 優化 - UPDATE 優化（避免行鎖升級為表鎖）

1. 鎖機制底層邏輯：行鎖 → 間隙鎖 → 表鎖的升級

行鎖（Record Lock）：僅鎖定匹配條件的行，需?WHERE?條件命中唯一索引（如主鍵、唯一索引）。
間隙鎖（Gap Lock）：鎖定索引區間（防止幻讀），若條件用范圍查詢（如?age > 18）且無唯一索引，會觸發間隙鎖。
表鎖（Table Lock）：若條件無索引，數據庫會全表掃描 + 鎖表，阻塞所有操作。

2. 行鎖優化：從反例到正例（含執行計劃分析）

-- 反例 1：無索引，觸發全表掃+表鎖
-- 執行計劃：type = ALL（全表掃），rows = 1000000（掃描 100 萬行）
UPDATE t_order SET status=1 WHERE create_time < '2023-01-01'; -- 正例 1：給 create_time 加索引，觸發行鎖（僅鎖匹配行）
-- 執行計劃：type = range（索引范圍掃），rows = 1000（掃描 1000 行）
CREATE INDEX idx_create_time ON t_order(create_time); 
UPDATE t_order SET status=1 WHERE create_time < '2023-01-01'; -- 反例 2：批量更新無 LIMIT，鎖太多行導致阻塞
UPDATE t_order SET status=1 WHERE status=0; -- 若 status=0 有 10 萬行，鎖競爭嚴重-- 正例 2：拆分批量更新，控制每次鎖的行數
-- 每次更新 100 行，循環執行直到完成
WHILE (1=1) DO UPDATE t_order SET status=1 WHERE status=0 LIMIT 100; IF ROW_COUNT() = 0 THEN LEAVE; END IF; -- 無更新時退出
END WHILE; -- 進階優化：顯式縮短事務時間（減少鎖持有時間）
BEGIN;
UPDATE t_order SET status=1 WHERE id=123; -- 走主鍵索引，行鎖
COMMIT; -- 立即釋放鎖，不阻塞其他操作

3. 鎖升級監控與排查（MySQL 為例）

-- 查看當前鎖等待情況
SELECT * FROM INFORMATION_SCHEMA.INNODB_LOCKS; 
SELECT * FROM INFORMATION_SCHEMA.INNODB_LOCK_WAITS; -- 定位慢更新 SQL（結合慢查詢日志）
-- 慢查詢日志配置：
slow_query_log = 1
slow_query_log_file = /var/log/mysql/slow.log
long_query_time = 1 -- 超過 1 秒的 SQL 記錄