1、問題現象
分布式集群采用水平分表的方式,將業務數據表的元組/行打散存儲到各個節點內。
2、技術背景
通過全并行數據處理技術和快速定位到數據存儲位置等手段可極大提升數據庫性能,GaussDB分布式部署下可以創建倆種類型表,在做實際業務系統開發時根據業務場景創建不同表。復制表一般使用在小數量、更新操作少的場景下。
- 分布表:數據會根據函數映射(hash,range,list),將數據打散在不同的DN上存儲。
- 復制表:每個DN上copy一份完整的數據。
如下圖:復制表與分布表數據處理過程
有四種分式方式:
分布方式 | 說明 |
Replication | 集群中每一個DN都有一份全量表數據。 |