告警解釋
當GTM主實例與GTM備實例連接異常或者GTM主實例未處于同步狀態時,產生該告警。
告警屬性
告警ID | 告警級別 | 可自動清除 |
---|---|---|
37003 | 嚴重 | 是 |
告警參數
參數名稱 | 參數含義 |
---|---|
ServiceName | 產生告警的服務名稱 |
RoleName | 產生告警的角色名稱 |
HostName | 產生告警的主機名 |
Instance | 產生告警的實例 |
對系統的影響
當GTM主實例與GTM備實例連接異常時,如果GTM主實例處于同步模式,系統將在120s內不可用,待檢測到該故障時,會將GTM主實例設成最高可用模式,系統恢復使用。如果是最高可用模式,系統仍然可以正常使用。
說明:
集群正常運行時,GTM主實例處于同步模式,主實例收到執行任務后會同步任務到備實例,主備實例間實時同步。當備實例故障且無法自動修復后,主實例將停止同步任務到備實例,此時稱主實例為最高可用模式。
可能原因
GTM主實例與GTM備實例連接異常。
處理步驟
查看告警原因。
- 執行如下命令查看集群GTM主備實例是否故障。
gs_om -t status --detail
- 是,修復故障實例,具體方法請參考“修復MPPDBServer實例”章節。
- 否,執行2。
- 查看集群GTM主備實例所在機器網絡是否正常,比如GTM主實例所在機器或者備實例所在機器機使用的網卡為eth0,使用下面命令查看網絡是否正常。
/sbin/ifconfig eth0
- 如果網卡正常,執行3。
- 如果顯示網卡不正常,請及時聯系硬件工程師修復網卡,再執行3。
- 查看告警是否仍然存在。
- 是,執行4。
- 否,處理完畢。
收集故障信息。