OpenMLDB v0.8.4 診斷工具全面升級

新的v0.8.4版本中,我們對于診斷工具進行了全面系統化的升級,以提供更加完整和智能化的診斷報告,有助于高效排查 OpenMLDB 集群問題,大幅提升運維效率。

相比于之前的版本,新的診斷工具增添一鍵診斷功能,使用openmldb_tool inspect就可以一鍵診斷集群的健康狀態。提供的信息包括XX DetailSummary & Hint兩個部分。XX Detail部分提供集群現狀信息;Summary & Hint部分總結了重點需要關注的信息點,并且智能提示可能有問題的地方及相應的對策,幫助用戶進行集群修復。 一般情況下,Summary & Hint部分的信息足夠用戶對集群進行對應的修復;對于更棘手的情況,用戶可參照XX Detail里的現狀信息進行處理,或者向我們提供報告,我們可以更快速地定位集群問題、進行修復指導。診斷工具的具體詳情可以參見文檔(https://openmldb.ai/docs/zh/main/maintain/diagnose.html)。 接下來我們簡單演示如何使用一鍵診斷功能來查看集群狀態以及如何快速解決常見問題。

報告講解與演示

以OpenMLDB Demo鏡像為例,啟動OpenMLDB集群。一鍵診斷后,用戶可以直接檢查末尾的Summary & Hint報告總結章,它將總結整個集群的狀態,包括Server是否在線,和Table是否健康。

健康狀態

綠色提示Server均在線和Table均健康,是正常的狀態。
file

異常狀態

如果某臺Tablet Server掉線了,總結將提示:
file

Server異常狀態

報告中,我們首先看到“offline servers”,報告提示我們需要先重啟它們。除非該節點是無數據的,其他任何情況,請優先恢復下線server節點,再對表的健康情況進行診斷。

Table異常狀態

我們已經將下線server恢復,再次診斷集群,報告如下圖所示。此時仍存在不健康的表。狀態有兩種:

  • 紅色Fatal狀態,說明此時表處于危險狀態,可能會讀寫失敗,需要立即處理。
  • 黃色Warn狀態,說明表的主分片都在活動中,讀寫是可以的,但也請及時處理,只是沒有Fatal緊急。

file
請注意這些表雖然仍然不健康,但它們有一些關聯的后臺OP正在執行。它們是集群自動發起的修復,用戶此時不需要手動修復,需要等待后臺OP完成。一般情況下,集群自動修復完成后,一鍵診斷會顯示集群已健康。

Table特別異常狀態

在實際的運維過程中,可能因為一些意外情況,導致類似下圖的情況。Table處于異常狀態且并沒有后臺OP正在運行,它意味著集群并未觸發自動修復或修復已經失敗。
file
這時候,就需要用戶手動操作了,根據報告末尾的提示鏈接進行recoverdata。如果recoverdata提示成功,可再次一鍵診斷,確認集群已恢復健康。

詳細報告

對于更棘手的情況,我們可以通過報告中的Detail部分來對當前集群進行分析。

Table Partition Detail

Table Partition Detail部分可以讓我們直觀地了解各個表現在處于什么樣的狀態。每個Partition分片的主從副本位于哪臺Tablet,副本本身是什么狀態,都有清晰的展示。結合Example,我們可以看到,一個分片pX代表其分片id,各個副本在Tablet Server上是元信息丟失,還是信息異常等。
file

Ops Detail

Ops Detail可以提示我們集群當前的后臺情況,是否自動修復失敗等。我們可以通過最后一個OP的時間和最后10個非完成OP的詳細狀態,來判斷集群是未觸發自動修復,還是正在修復,或者是修復已失敗,或者是部分表修復失敗。

提供報告

用戶如果通過以上流程,仍無法修復集群,請向我們提供Detail部分的信息,我們可以更快速地定位集群問題、進行修復指導。

相關閱讀

  • OpenMLDB 官網: https://openmldb.ai/
  • OpenMLDB GitHub 主頁: https://github.com/4paradigm/OpenMLDB
  • OpenMLDB 文檔: https://openmldb.ai/docs/zh/
  • OpenMLDB 微信交流群

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/166094.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/166094.shtml
英文地址,請注明出處:http://en.pswp.cn/news/166094.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

首個央企量子云計算項目,中標!

6月29日,北京玻色量子科技有限公司(簡稱“玻色量子”)成功中標中國移動云能力中心“2023—2024年量子算法及光量子算力接入關鍵技術研究項目”,這是玻色量子繼與移動云簽訂“五岳量子云計算創新加速計劃”后🔗&#xf…

角色管理--體驗產品專家崗

研發組織管理--角色管理--體驗產品專家崗 定位 產品用戶代言人,產品體驗守門員,保證用戶體驗感知不低于行業水平并嘗試新體驗; 所需資質 對產品交互有自己的心得,可通過設計工具直觀表達觀點能站在用戶角度思考問題&#xff0c…

揭秘 systemd:釋放 Linux 服務管理的力量【systemd 一】

🎏:你只管努力,剩下的交給時間 🏠 :小破站 揭秘 systemd:釋放 Linux 服務管理的力量【systemd 一】 前言第一:systemd簡介第二:核心概念解析第三:服務管理與啟動過程第四…

bootstrap插件的基本使用

1.更新表格數據(根據行索引:僅更新一個單元格) var rows {index : index, //更新列所在行的索引field : "status", //要更新列的fieldvalue : "正常" //要更新列的數據 } $(#table_Id).bootstrapTable("updateCel…

DELPHI開發APP回憶錄二安卓與pc端路徑的選擇

路徑方法WinAndroidGetHomePathC:\Users\ggggcexx\AppData\Roaming/data/user/0/com.stella.scan/files/GetDocumentsPathC:\Users\ggggcexx\Documents/data/user/0/com.embarcadero.FirstAidExpert_FMX_D11/filesGetSharedDocumentsPathC:\Users\Public\Documents/storage/emu…

杰發科技AC7801——EEP內存分布情況

簡介 按照文檔進行配置 核心代碼如下 /*!* file sweeprom_demo.c** brief This file provides sweeprom demo test function.**//* Includes */ #include <stdlib.h> #include "ac780x_sweeprom.h" #include "ac780x_debugout.h"/* Define …

導出文件到指定路徑??

需求&#xff1a;點擊導出pdf按鈕&#xff0c;彈出系統文件夾彈框&#xff0c;可以選擇保存文件的位置。 經查詢window.showSaveFilePicker可實現&#xff0c;但這個api處于實驗階段&#xff0c;且用下來確實和瀏覽器類型、瀏覽器版本、以及本身api就不穩定有關系。 代碼見下…

Python,FastAPI,mLB網關,無法訪問/docs

根源就是js和ccs文件訪問路由的問題&#xff0c;首先你要有本地的文件&#xff0c;詳情看https://qq742971636.blog.csdn.net/article/details/134587010。 其次&#xff0c;你需要這么寫&#xff1a; /unicontorlblip就是我配置的mLB網關路由。 app FastAPI(titleoutpaint…

【力扣:421,2935】數組內最大異或對問題

思路&#xff1a;從最高位向低位構造&#xff0c;對每一位利用哈希表尋找是否存在可使此位為1的數 第一輪找1&#xff1a;清空哈希表&#xff0c;1&#xff0c;2存1&#xff0c;到3發現1^01&#xff0c;res|1<<3 第二輪找11&#xff1a;清空哈希表&#xff0c;1存10&…

如何開發洗鞋店用的小程序

隨著人們生活水平的提高&#xff0c;洗護行業是越來越細分化了&#xff0c;從最開始的干洗店包含洗護行業的所有服務到現在有專門為洗鞋開的店&#xff0c;如果開發一款洗鞋店用的小程序&#xff0c;可以實現用戶在家下單直接有人上門取鞋的話&#xff0c;應該如何去開發呢&…

將 Spring 微服務與 BI 工具集成:最佳實踐

軟件開發領域是一個不斷發展的領域&#xff0c;新的范式和技術不斷涌現。其中&#xff0c;微服務架構和商業智能&#xff08;BI&#xff09;工具的采用是兩項關鍵進步。隨著 Spring Boot 和 Spring Cloud 在構建強大的微服務方面的普及&#xff0c;了解這些微服務如何與 BI 工具…

11-@Transaction與AOP沖突解決

如題&#xff0c;最近碰到了一個問題&#xff0c;在public方法上添加Transaction沒有生效&#xff0c;事務沒有回滾。 我自己模擬了一個功能&#xff0c;向數據庫表User里面插入用戶數據。說一下代碼背景&#xff0c; 數據庫MySQL&#xff0c;持久化層Mybatis&#xff0c;項目使…

Vue3(setup)中使用vue-cropper圖片上傳裁剪插件,復制代碼直接使用

最近在項目中用到上傳裁剪&#xff0c;看了一下代碼&#xff0c;覺得這插件可可以。梳理了一下代碼分享給大家 前端UI組件element-plus 如果你也用到了 &#xff0c;快速幫你解決了問題,別忘記點贊收藏 1.首先看效果圖 因為版本vue-cropper 眾多 &#xff0c;雖然網上有各…

阿里云windwos 安裝oracle數據庫,外部用工具連接不上,只能在服務器本機通過127.0.0.1 連接

1. 首先檢查阿里云服務器安全組端口是否開放 oracle 數據庫端口 2. 其次找到oracle 安裝的目錄&#xff0c;打開這倆個文件&#xff0c;將localhost 修改為 服務器本機名稱 3.重啟oracle 監聽服務&#xff0c;就可以連接了

ModuleNotFoundError: No module named ‘Tkinter‘

ModuleNotFoundError: No module named ‘Tkinter’ Windows 不要用 import tkinter 用from tkinter import * from tkinter import * root Tk() w Label(root, text"Hello, world!") w.pack() root.mainloop()mac python 3.10版本 brew install python-tk3.1…

技術部工作職能規劃分析

前言 技術部的職能。以下是一個基本的框架,其中涵蓋了技術部在公司中的關鍵職能和子職能。 主要職能 技術部門的主要職能分為以下幾個板塊: - 技術規劃與戰略: 制定技術規劃和戰略,與業務團隊合作確定技術需求。 研究和預測技術趨勢,引領公司在技術創新和數字化轉型方…

基于springboot實現智慧黨建系統項目【項目源碼】計算機畢業設計

基于springboot實現智慧黨建系統演示 Java技術 Java是由Sun公司推出的一門跨平臺的面向對象的程序設計語言。因為Java 技術具有卓越的通用性、高效性、健壯的安全性和平臺移植性的特點&#xff0c;而且Java是開源的&#xff0c;擁有全世界最大的開發者專業社群&#xff0c;所以…

【Unity細節】Unity中為什么用字符串加載對象,檢查多便都加載不出來—(命名細節)

&#x1f468;?&#x1f4bb;個人主頁&#xff1a;元宇宙-秩沅 hallo 歡迎 點贊&#x1f44d; 收藏? 留言&#x1f4dd; 加關注?! 本文由 秩沅 原創 &#x1f636;?&#x1f32b;?收錄于專欄&#xff1a;unity細節和bug &#x1f636;?&#x1f32b;?優質專欄 ?【…

【Python】itertools模塊,補充:可迭代對象、迭代器

Python中 itertools模塊創建高效迭代器、處理序列數據集。 此模塊所有函數返回迭代器&#xff0c;可用for循環獲取迭代器中的內容&#xff0c;也可用list(...)用列表形式顯示內容。 import itertools[ x for x in dir(itertools) if not x.startswith(_)] # 結果&#xff1a;…

什么是網絡爬蟲技術?它的重要用途有哪些?

網絡爬蟲&#xff08;Web Crawler&#xff09;是一種自動化的網頁瀏覽程序&#xff0c;能夠根據一定的規則和算法&#xff0c;從互聯網上抓取和收集數據。網絡爬蟲技術是隨著互聯網的發展而逐漸成熟的一種技術&#xff0c;它在搜索引擎、數據挖掘、信息處理等領域發揮著越來越重…