1.億級積分數據分庫分表：總體方案設計

項目背景

????????以一個積分系統為例，積分系統最核心的有積分賬戶表和積分明細表：

? ? ? ? 隨著業務的增長、時間的推移，積分明細的數據量越來越多，單表數據量太大，產生很多問題：慢SQL，加字段、索引比較耗時（雖然可以用MySQL8.0的新特性INSTANT算法加字段），統計查詢很慢，數據庫CPU壓力大等

????????目前積分系統的積分明細數據現存幾億條，每日新增積分明細數據大幾十萬，并且隨著活動的接入還在逐漸遞增，慢慢的帶來了很多問題，需要進行優化處理。

? ? ? ? 歷史數據歸檔不行嗎

????????因為系統積分規則規定積分有效期兩年，并且積分扣減、退款、過期等操作需要對積分明細溯源，最近兩年的積分明細數據也有幾個億，即使將兩年前的冷數據歸檔，也無法解決積分明細單表幾億數據量的問題。

????????根據積分現有數據量以及日增長量進行評估，未來3-5年內單數據庫實例能夠滿足積分數據的存儲，并且積分系統的寫入TPS單實例可以支撐，本次積分決定只分表不分庫。

? ? ? ? 什么情況適合用數據歸檔？

????????如果能把歷史冷數據歸檔，熱數據一兩億左右、讀寫并發不太高的情況下，利用好數據庫索引、數據庫配置高一些完全可以不用分表，采用歷史數據歸檔也可以解決很多問題。但是大表還是有一些其他的問題，比如加字段比較耗時。

????????分庫分表有很多問題

????????網上動不動就說超過2000萬數據就要分庫分表并不太對，在單表數據一兩億、并發不是很高、利用好數據庫索引的情況下，MySQL數據庫配置高一點是完全可以扛得住的。

????????而且能不分庫分表就不要分庫分表，分庫分表會產生很多問題，沒有其他優化手段了再進行分庫分表。分庫分表可能會產生的問題如下：

????????分庫分表組件選擇Sharding-JDBC，因為目前該項目文檔較為豐富、社區活躍度高、無中心化、性能相較于proxy方式性能更好，對于開發來說使用更為靈活可控。官網地址Apache ShardingSphere

????????需要拆分的表：point_info（積分明細表）

????????根據目前的數據量、單日新增的數據量來進行分析，計劃分為128張表，未來3-5年內單表數據盡量不要超過2000萬，后期分表數據量大了可以進行歷史數據歸檔。

????????拆分后的表為point_info[0-127]，采用user_id作為分片鍵，選取user_id后四位取模定位到具體的分表

????????table后綴 = (user_id后四位) % 128

? ? ? ? 如果怕user_id的尾數不均勻，可以將hashcode(user_id)%128來計算分表下標

????????分表數量為啥是128，不是127或者100？

????????我自己的理解如下：

????????如果還有其他的好處歡迎指正

????????因為只進行了分表，沒有進行分庫，所以沒有分布式事務問題。

????????假如后面進行了分庫分表，可以通過將相同用戶的積分賬戶表和積分明細表分到同一個分庫中，來避免同一個用戶操作賬戶和明細的分布式事務問題。

????????shardingsphere里面也有一些分布式事務的支持，比如XA，Seata框架的AT模式等

????????原來單表時主鍵采用MySQL自增id，分表之后再使用自增id會導致不同表主鍵值重復，可以使用雪花算法、美團的Leaf等生成分布式ID，也可以自定義實現。

????????注意：原生雪花算法有時鐘回撥問題、低頻場景下生成的id都是偶數的問題，需要進行優化一下，感興趣的話可以看下我的另一篇博客?雪花算法生成分布式ID源碼分析及低頻場景下全是偶數的解決辦法

簡要描述一下整個流程：

線上庫新的分表創建配置完成，然后按照下面的步驟執行：

改造雙寫代碼預發測試（多種case跑一下，雙寫開關等校驗），沒問題發布上線，上線時雙寫開關默認關閉，可以通過配置中心動態開啟，打開雙寫開關（新表寫入失敗先忽略，因為更新和刪除操作會因為新表數據不存在而失敗），記錄雙寫開始時間點A
將老表的積分明細的createTime小于等于雙寫開始時間點A+5分鐘（防止時間不同步導致少遷移數據，預留一些緩沖時間）的數據進行全量遷移到分表
新老數據全量數據校驗，查看數據是否一致；同時定時任務每隔一小段時間進行增量校驗，增量數據因為讀取新老數據存在短暫時間差可能會瞬時不一致，這種數據隔一段時間再次校驗，多次校驗還不一致的數據進行數據訂正（老表數據覆蓋到新表數據）
改造代碼，添加雙讀的邏輯上線（讀新表的開關默認關閉）
低流量節點(凌晨過后)進行白名單、灰度切流userId%10000，進行驗證，逐步流量打開，持續觀察
雙寫開關切到新表，保證只寫新表（也可以繼續寫老表一段時間，或者創建一個新表往老表同步的canal任務，方便回滾），完成數據遷移方案
系統穩定運行一段時間，遷移&雙寫代碼下線，老表進行資源釋放

????????為什么沒有采用全量同步+canal增量同步方式，這種方式不是比雙寫實現更簡單嗎？怎么進行雙寫？雙寫有什么好處？后面會繼續寫一篇單獨介紹。