告警解釋
當DN主實例有未同步到DN備實例的xlog日志被刪除時,產生該告警。
告警屬性
告警ID | 告警級別 | 可自動清除 |
---|---|---|
37001 | 嚴重 | 是 |
告警參數
參數名稱 | 參數含義 |
---|---|
ServiceName | 產生告警的服務名稱 |
RoleName | 產生告警的角色名稱 |
HostName | 產生告警的主機名 |
Instance | 產生告警的實例 |
對系統的影響
DN主實例pg_xlog目錄中的xlog文件被刪除后,與之對應的DN備實例將無法從DN主實例上同步xlog日志。此時將觸發對備機的重建,重建會增加備機物理節點的網絡壓力。如果丟失的日志是DN主實例正在使用的xlog日志,則會造成部分數據丟失,導致DN主實例異常。
可能原因
- 當DN主實例正在寫事務時,其中pg_xlog目錄下的xlog文件被刪除。
- 當DN備實例進程異常,而對應的DN主實例在這段時間內存在寫事務,該DN主實例的pg_xlog目錄中的xlog文件被刪除。
處理步驟
- 集群會自動觸發對備機的重建,并在重建成功后集群自動恢復告警。
- 若長時間沒有恢復,重啟節點。