刪除變慢問題

問題:?有一個場景,每天都會刪除數據,SQL為delete from xxx where record_date < DATE_SUB(now(), INTERVAL ? DAY) limit 1000 ,一直循環執行,當執行到最后一次滿足條件的時候,就會很慢

原理分析

  1. 索引與數據分布

    • 如果?record_date?字段沒有索引,數據庫在執行?DELETE?語句時需要進行全表掃描(Full Table Scan),以找到滿足?record_date < DATE_SUB(now(), INTERVAL ? DAY)?條件的記錄。

    • 隨著數據逐步刪除,剩余的數據量減少,但數據庫仍然需要掃描整個表(或索引)來找到符合條件的記錄,尤其是在數據分布不均勻的情況下,查詢效率會顯著下降。

  2. 刪除操作的內部機制

    • 刪除操作不僅會刪除數據,還會更新索引、寫入事務日志(如MySQL的undo log和redo log),并可能觸發鎖機制(如行鎖或表鎖)。

    • 當刪除操作接近尾聲時,數據庫可能需要處理更多的索引維護和日志寫入操作,導致性能下降。

  3. 數據碎片化

    • 頻繁的刪除操作會導致數據頁(Data Page)出現碎片化,數據庫在查詢時需要掃描更多的數據頁來找到符合條件的記錄,從而降低查詢效率。

  4. 查詢優化器的行為

    • 數據庫的查詢優化器可能會根據統計信息調整執行計劃。當數據量減少到一定程度時,優化器可能會選擇不同的執行計劃(如從索引掃描切換到全表掃描),導致性能下降。


優化建議

  1. 添加索引

    • 確保?record_date?字段上有索引(如單列索引或組合索引),以加速條件過濾。例如:

      sql

      CREATE INDEX idx_record_date ON xxx(record_date);
    • 如果表中有其他常用查詢條件,可以考慮創建組合索引。

  2. 分批刪除優化

    • 使用主鍵或唯一鍵進行分批刪除,避免全表掃描。例如:

      sql

      DELETE FROM xxx WHERE id IN (SELECT id FROM xxx WHERE record_date < DATE_SUB(now(), INTERVAL ? DAY) LIMIT 1000
      );
    • 這種方法可以利用索引快速定位需要刪除的記錄,減少掃描范圍。

  3. 分區表

    • 如果數據量非常大,可以考慮使用分區表(Partitioning),按時間(如按天、按月)對數據進行分區。刪除過期數據時,直接刪除整個分區,效率會顯著提升。例如:

      sql

      ALTER TABLE xxx DROP PARTITION p20230101;
  4. 優化刪除邏輯

    • 在刪除操作前,先查詢符合條件的記錄數量,避免無意義的掃描。例如:

      sql

      SELECT COUNT(*) FROM xxx WHERE record_date < DATE_SUB(now(), INTERVAL ? DAY);
    • 如果剩余數據量較少,可以一次性刪除,避免多次循環。

  5. 定期優化表

    • 刪除操作會導致數據碎片化,定期執行表優化(如?OPTIMIZE TABLE)可以整理數據頁,提升查詢性能。例如:

      sql

      OPTIMIZE TABLE xxx;
  6. 調整事務大小

    • 如果刪除操作涉及大量數據,可以將刪除操作拆分為多個小事務,避免長時間鎖定表和占用過多日志空間。例如:

      sql

      START TRANSACTION;
      DELETE FROM xxx WHERE record_date < DATE_SUB(now(), INTERVAL ? DAY) LIMIT 1000;
      COMMIT;
  7. 使用歸檔表

    • 將需要刪除的數據先移動到歸檔表,再從歸檔表中刪除。這種方法可以減少對主表的操作壓力。例如:

      sql

      INSERT INTO xxx_archive SELECT * FROM xxx WHERE record_date < DATE_SUB(now(), INTERVAL ? DAY);
      DELETE FROM xxx WHERE record_date < DATE_SUB(now(), INTERVAL ? DAY);

執行計劃分析

您可以通過?EXPLAIN?命令查看?DELETE?語句的執行計劃,重點關注以下內容:

  • type:查詢類型,如?index(索引掃描)或?ALL(全表掃描)。

  • rows:掃描的行數,如果值過大,說明查詢效率較低。

  • key:使用的索引,如果沒有使用索引,可能需要優化索引設計。

例如:

sql

EXPLAIN DELETE FROM xxx WHERE record_date < DATE_SUB(now(), INTERVAL ? DAY) LIMIT 1000;

總結

刪除操作變慢的原因主要與索引缺失、數據碎片化、查詢優化器行為以及刪除操作的內部機制有關。通過添加索引、優化刪除邏輯、使用分區表等方法,可以顯著提升刪除操作的效率。如果數據量非常大,建議結合歸檔表和分區表的設計,進一步優化數據清理任務。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/72087.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/72087.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/72087.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

lua基礎語法學習

lua基礎語法學習 文章目錄 lua基礎語法學習1. 基礎2. 輸入輸出3. 分支結構與循環結構4. 函數5. 元表與元方法6. 面向對象 1. 基礎 注釋 --單行注釋--[[ 多行注釋 --]]標識符 標識符以一個字母 A 到 Z 或 a 到 z 或下劃線 _ 開頭后加上 0 個或多個字母&#xff0c;下劃線&…

使用DeepSeek實現自動化編程:類的自動生成

目錄 簡述 1. 通過注釋生成C類 1.1 模糊生成 1.2 把控細節&#xff0c;讓結果更精準 1.3 讓DeepSeek自動生成代碼 2. 驗證DeepSeek自動生成的代碼 2.1 安裝SQLite命令行工具 2.2 驗證DeepSeek代碼 3. 測試代碼下載 簡述 在現代軟件開發中&#xff0c;自動化編程工具如…

【SpringBoot】數據訪問技術spring Data、 JDBC、MyBatis、JSR-303校驗

Spring Boot 數據訪問技術及特性 目錄標題 Spring Boot 數據訪問技術及特性摘要1. 引言2. Spring Data架構與原理2.1 Spring Data概述2.2 Spring Data核心組件2.3 Spring Boot與Spring Data的集成機制 3. Spring Boot與JDBC的整合3.1 JDBC整合流程3.2 數據源自動配置3.3 JdbcTe…

【時序預測】深度時序預測算法的對比與核心創新點分析

時間序列預測是機器學習和深度學習領域的重要研究方向&#xff0c;廣泛應用于金融、交通、能源、醫療等領域。近年來&#xff0c;隨著深度學習技術的發展&#xff0c;各種基于深度學習的時間序列預測算法層出不窮。這些算法在模型架構、訓練方式和應用場景上各有特色。本文將對…

JVM線程分析詳解

java線程狀態&#xff1a; 初始(NEW)&#xff1a;新創建了一個線程對象&#xff0c;但還沒有調用start()方法。運行(RUNNABLE)&#xff1a;Java線程中將就緒&#xff08;ready&#xff09;和運行中&#xff08;running&#xff09;兩種狀態籠統的稱為“運行”。 線程對象創建…

android智能指針android::sp使用介紹

android::sp 是 Android 中的智能指針&#xff08;Smart Pointer&#xff09;的實現&#xff0c;用于管理對象的生命周期&#xff0c;避免手動管理內存泄漏等問題。它是 Android libutils 庫中重要的一部分&#xff0c;常用于管理繼承自 android::RefBase 的對象。 與標準庫中…

spring整合mybatis詳細步驟

spring整合mybatis的全部過程(整合方式一 &#xff1a;簡單版) 1.在pom.xml中導入mybatis相應的jar包&#xff1a; (2) < dependency > < groupId >org.mybatis</ groupId > < artifactId >mybatis</ artifactId > < version >3.5.3&…

2025年Linux主力系統選擇指南:基于最新生態的深度解析(附2025年發行版對比速查表)

Linux發行版生態在2025年持續演進&#xff0c;既有經典系統的迭代升級&#xff0c;也有新興項目的崛起。本文結合最新行業動態&#xff0c;從個人用戶到企業場景&#xff0c;梳理主力系統選擇策略&#xff0c;助你找到最適合的Linux發行版。 一、新手友好型&#xff1a;平滑過渡…

ai-2、機器學習之線性回歸

機器學習之線性回歸 1、機器學習2、線性回歸2.1、梯度下降法 3、python下調用scikit-learn 1、機器學習 2、線性回歸 ####所以y可以當成我們需要的結果&#xff0c;根據公式可以求的y一撇的值更小&#xff0c;所以更接近需要的結果&#xff0c;所以y一撇擬合性更好 2.1、梯度下…

Flutter 學習之旅 之 flutter 在 Android 端進行簡單的打開前后相機預覽 / 拍照保存

Flutter 學習之旅 之 flutter 在 Android 端進行簡單的打開前后相機預覽 / 拍照保存 目錄 Flutter 學習之旅 之 flutter 在 Android 端進行簡單的打開前后相機預覽 / 拍照保存 一、簡單介紹 二、簡單介紹 camera 三、安裝 camera 四、簡單案例實現 五、關鍵代碼 一、簡單…

【原創】Open WebUI 本地部署

使用官網的默認部署&#xff0c;遇到不少的問題。比如白屏問題&#xff0c;其實需要修改幾個參數即可。 其實在部署的時候有不少參數 WEBUI_AUTH False ENABLE_OPENAI_API 0 PATH /usr/local/bin:/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin LANG C.UTF-8…

【造個輪子】使用Golang實現簡易令牌桶算法

本文目錄 1. 令牌桶算法2. 調用第三方庫實現令牌桶3. 手撕令牌桶 前言&#xff1a;之前在Bluebell社區項目中&#xff0c;我們使用了開源的庫來實現令牌桶限流&#xff0c;這次我們試著使用Go來手撕實現下令牌桶算法。 1. 令牌桶算法 為了防止網絡擁塞&#xff0c;需要限制流…

C#開發的Base64編碼及解碼完整源碼及注意事項

在軟件開發時&#xff0c;經常用Base64編碼和解碼功能。本文介紹一個簡單易用的Base64 編碼和解碼工具&#xff0c;顧名思義&#xff0c;就是簡單快捷地進行 Base64 代碼的解碼或編碼操作。您的數據可以輕松地編碼為 Base64 編碼&#xff0c;也可以解碼為可讀的格式。傳輸數據時…

【Linux第一彈】Linux基礎指令(上)

目錄 1.ls指令 1.1 ls使用實例 2.pwd指令 3.cd指令 3.1 cd使用實例 4.touch指令 4.1touch使用實例 5.mkdir指令 5.1mkdir使用實例 6.rmdir指令和rm指令 6.1 rmdir指令使用實例->: 6.2 rm指令使用實例 7.man指令 8.cp指令 8.1 cp 使用實例 9.mv指令 9.1mv使用…

RabbitMQ系列(七)基本概念之Channel

RabbitMQ 中的 Channel&#xff08;信道&#xff09; 是客戶端與 RabbitMQ 服務器通信的虛擬會話通道&#xff0c;其核心作用在于優化資源利用并提升消息處理效率。以下是其核心機制與功能的詳細解析&#xff1a; 一、Channel 的核心定義 虛擬通信鏈路 Channel 是建立在 TCP 連…

Zookeeper(80)Zookeeper的常見問題有哪些?

Zookeeper作為分布式系統的協調服務&#xff0c;常見的問題主要集中在配置、性能、連接管理、數據一致性和節點故障等方面。以下是一些常見問題及其詳細解決方法和代碼示例。 1. 配置問題 問題描述 配置不當可能導致 Zookeeper 集群無法正常啟動或運行效率低下。 解決方法 …

如何管理路由器

一、管理路由器的必要性 1、需要修改撥號上網的密碼。 2、需要修改WIFI的SSID名字和密碼。 3、設置DHCP協議信息。 4、設置IP地址的過濾規則。 5、給某個設備連接設置網絡限速。 二、常見的方式 (一)web網頁方式 1、計算機用雙絞線或者WIFI的方式連接路由器。 2、在計算機中打開…

linux vim 撤銷 回退操作

在Linux的vim編輯器中&#xff0c;撤銷和回退操作是非常基本的&#xff0c;但它們可以通過不同的方式實現&#xff0c;具體取決于你想要的精確效果。下面是一些常用的方法&#xff1a; 1. 撤銷&#xff08;Undo&#xff09; 單個撤銷&#xff1a; 你可以通過按下u鍵來撤銷上一…

淺談流媒體協議以及視頻編解碼

流媒體協議介紹 流媒體協議用于傳輸視頻、音頻等多媒體數據&#xff0c;確保數據流暢地傳輸到用戶設備。常見的流媒體協議包括 RTMP、HLS、DASH、WebRTC 等&#xff0c;每種協議具有不同的特點和適用場景。 1. RTMP (Real-Time Messaging Protocol) 定義&#xff1a;由 Adob…

AF3 DataPipeline類process_multiseq_fasta 方法解讀

AlphaFold3 data_pipeline 模塊DataPipeline類的 process_multiseq_fasta 方法用于處理多序列 FASTA 文件,生成 AlphaFold3 結構預測所需的特征,適用于多鏈復合物的預測。它結合了 Minkyung Baek 在 Twitter 上提出的“AlphaFold-Gap”策略,即通過在多鏈 MSA 中插入固定長度…