Elasticsearch集群出現腦裂(Split-Brain)如何排查原因和處理?
1. 腦裂(Split-Brain)背景
- 定義:腦裂是指 Elasticsearch 集群由于網絡分區(network partition)或其他原因分裂成多個獨立的子集群,每個子集群認為自己是主集群,導致不同的子集群可能獨立處理請求,造成數據不一致。
- 集群配置:
- 3 個主節點(
master-node-1: 192.168.1.1
,master-node-2: 192.168.1.2
,master-node-3: 192.168.1.3
)。 - 3 個數據節點(
data-node-1: 192.168.1.4
,data-node-2: 192.168.1.5
,data-node-3: 192.168.1.6
)。 discovery.zen.minimum_master_nodes
設置為 2(基于公式N/2 + 1
,N=3)。
- 3 個主節點(
- 腦裂發生場景:
- 網絡分區導致部分主節點無法通信(例如,
master-n
- 網絡分區導致部分主節點無法通信(例如,