StarRocks BE宕機排查

StarRocks BE宕機排查

排查是否OOM

dmesg -T|grep -i oom #排查是否oom

原因:

2.X版本OOM原因

  • BE 的配置文件 (be.conf) 中 mem_limit 配置不合理,需要配置mem_limit=(機器總內存-其他服務占用內存-1~2g(系統預留))

比如機器內存40G,上面有個Mysql,理論上限會用4G,那么配置下mem_limit=34G (40-4-2)

排查系統參數

一般先檢查下系統參數配置是否合理,建議參考 https://docs.starrocks.io/zh/docs/deployment/environment_configurations/ 配置。

尤其需要關注ulimit、overcommit和swap參數,檢查方式如下

ulimit檢查

需要關注max processes和max open files,需要確保>=65535

ulimit -a #查看系統配置
cat /proc/$be_pid/limits #查看be進程配置

overcommit檢查

以下值應該為 1

cat /proc/sys/vm/overcommit_memory

swap檢查

以下值應該為 0,確保關閉swap

cat /proc/sys/vm/swappiness

排查BE日志

如上參數配置正確的前提下,如果還存在crash,當前crash都會在be.out中打印異常棧

首先獲取be.out

# less be.outquery_id:0862041d-07bd-11f0-9214-005056853513, fragment_instance:0862041d-07bd-11f0-9214-005056853518..............*** Aborted at 1742716891 (unix time) try "date -d @1742716891" if you are using GNU date ***
PC: @          0x527d26b starrocks::SegmentIterator::_finish_late_materialization()
*** SIGSEGV (@0x0) received by PID 22176 (TID 0x7f06987b1700) from PID 0; stack trace: ***@          0x688b642 google::(anonymous namespace)::FailureSignalHandler()@     0x7f089e584630 (unknown)@          0x527d26b starrocks::SegmentIterator::_finish_late_materialization()@          0x5288648 starrocks::SegmentIterator::_do_get_next()@          0x528aa30 starrocks::SegmentIterator::do_get_next()@          0x530e573 starrocks::ProjectionIterator::do_get_next()@          0x5994675 starrocks::SegmentIteratorWrapper::do_get_next()@          0x57c62d3 starrocks::TimedChunkIterator::do_get_next()@          0x5341706 starrocks::TabletReader::do_get_next()@          0x3b0271b starrocks::pipeline::OlapChunkSource::_read_chunk_from_storage()@          0x3b02e42 starrocks::pipeline::OlapChunkSource::_read_chunk()@          0x3afba17 starrocks::pipeline::ChunkSource::buffer_next_batch_chunks_blocking()@          0x37c0c38 _ZZN9starrocks8pipeline12ScanOperator18_trigger_next_scanEPNS_12RuntimeStateEiENKUlvE_clEv@          0x38d4c91 starrocks::workgroup::ScanExecutor::worker_thread()@          0x2ed30ec starrocks::ThreadPool::dispatch_thread()@          0x2ecc7ba starrocks::Thread::supervise_thread()@     0x7f089e57cea5 start_thread@     0x7f089d97d9fd __clone@                0x0 (unknown)
  1. 可先通過關鍵去常見 Crash / BUG 堆棧查詢 搜索(上面關鍵字是 _finish_late_materialization),判斷是不是已知問題;
  2. 根據query_id去fe審計日志查找sql;

參考:https://forum.mirrorship.cn/t/topic/4930

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/75021.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/75021.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/75021.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

邏輯回歸(Logistic Regression)模型的概率預測函數

以二分類問題為例,常見的損失函數有 負對數似然損失(neg log-likelihood loss),交叉熵損失(cross entropy loss),deviance loss指數損失(exponential loss)。 前三者雖然名字不同,但卻具有相同的表達形式。此外,neg …

函數式組件中的渲染函數 JSX

在 Vue.js 和 React 等現代前端框架中,函數式組件已成為一種非常流行的設計模式。函數式組件是一種沒有內部狀態和生命周期方法的組件,其主要功能是接受 props 并渲染 UI。隨著這些框架的演進,渲染函數和 JSX(JavaScript XML&…

Android 動態設置默認Launcher(默認應用 電話-短信-瀏覽器-主屏幕應用))

Android 動態設置默認Launcher(默認應用 電話-短信-瀏覽器-主屏幕應用)) 文章目錄 場景需求參考資料思路期待效果 實現方案源碼流程分析和思路實現DefaultAppActivityHandheldDefaultAppFragmentHandheldDefaultAppPreferenceFragmentDefaultAppChildFragmentDefaul…

Qt下載模板到本地文件內容丟失問題

上源碼 關鍵點已標注在源碼中 A, B… // 保存的文件路徑后綴QString dateTime Myapp::getCurrentTimeDescYMDHms().replace(" ", "").replace("-", "").replace(":", "");// 臨時文件名稱QString newFileName Q…

【數學建模】動態規劃算法(Dynamic Programming,簡稱DP)詳解與應用

動態規劃算法詳解與應用 文章目錄 動態規劃算法詳解與應用引言動態規劃的基本概念動態規劃的設計步驟經典動態規劃問題1. 斐波那契數列2. 背包問題3. 最長公共子序列(LCS) 動態規劃的優化技巧動態規劃的應用領域總結 引言 動態規劃(Dynamic Programming,簡稱DP)是一…

藍橋杯備考------>雙指針(滑動窗口)

來看哈我們這道例題 我們第一種想法應該就是暴力求解,枚舉每個子數組 當我們枚舉第一個數的時候,我們要從第一個數開始挨個枚舉每個結尾 如圖,以第一個數開頭的最長不重復數我們就枚舉完了 然后我們讓兩個指針全部到第二個數 再枚舉第二個…

python實現股票數據可視化

最近在做一個涉及到股票數據清洗及預測的項目,項目中需要用到可視化股票數據這一功能,這里我與大家分享一下股票數據可視化的一些基本方法。 股票數據獲取 目前,我已知的使用python來獲取股票數據方式有以下三種: 爬蟲獲取,實現…

【15】Selenium 爬取實戰

一、selenium適用場景 二、爬取目標 三、爬取列表頁 (1)初始化 (2)加載列表頁 (3)解析列表頁 (4)main 四、爬取詳情頁 (1)加載詳情頁 (2…

如何封裝一個上傳文件組件

#今天用el-upload感到很多不方便,遂決定自己封裝一個。注:本文不提供表面的按鈕樣式和文件上傳成功后的樣式,需要自己創建。本文僅介紹邏輯函數# 1,準備幾個表面用來指引上傳的元素 2,創造統一的隱藏文件上傳輸入框&…

【計網】數據包

期末復習自用的,處理得比較草率,復習的同學或者想看基礎的同學可以看看,大佬的話可以不用浪費時間在我的水文上了 1.數據包的定義: 數據包是網絡通信中的基本單元,它包含了通過網絡傳輸的所有必要信息。數據包的結構…

HTTP抓包Websocket抓包(Fiddler)

近期時常要和各個廠商的java云平臺打交道:登錄、上傳、下載等,程序的日志雖必不可少,但前期調試階段,免不了遇到問題,這時有一個稱手的抓包工具就顯得尤為重要了。 Fiddler Everywhere是一款跨平臺的網絡調試工具&…

Git和GitCode使用(從Git安裝到上傳項目一條龍)

第一步 菜鳥教程-Git教程 點擊上方鏈接,完成Git的安裝,并了解Git 工作流程,知道Git 工作區、暫存區和版本庫的區別 第二步 GitCode官方幫助文檔-SSH 公鑰管理 點擊上方鏈接,完成SSH公鑰設置 第三步(GitCode的官方引…

基于 WebAssembly 的 Game of Life 交互實現

一、前言 在前期的實現中,我們使用 Rust 編寫核心邏輯,并通過 WebAssembly 將其引入到 Web 環境中,再利用 JavaScript 進行渲染。接下來,我們將在這一基礎上增加用戶交互功能,使模擬過程不僅能夠自動演化,…

【keil】單步調試

一、步驟 1、打開stc-isp軟件 2.打開keil仿真設置,選擇對應的單片機型號 3.點擊將所選目標單片機設置為仿真芯片,點擊下載,按一下單片機打下載按鈕 4.此時已經將仿真程序下載到單片機 5.此時點擊options,找到debug選擇STC Montor 51 Driv…

c++弱指針實現原理

在 C 中,弱指針(std::weak_ptr)是一種特殊的智能指針,其核心目標是?解決 std::shared_ptr 的循環引用問題?,同時不增加對象的引用計數。它的實現原理基于與 std::shared_ptr 共享的 ?控制塊(Control Blo…

【ManiSkill】環境success條件和reward函數學習筆記

1. “PickCube-v1” info["success"]:用于指示任務是否成功完成 布爾型張量,在環境的evaluate()方法中計算并返回: "success": is_obj_placed & is_robot_static這確保了機器人不僅能將物體準確放置在目標位置&am…

用空閑時間做了一個小程序-二維碼生成器

一直在摸魚中賺錢的大家好呀~ 先向各位魚友們匯報一下情況,目前小程序已經有900的魚友注冊使用過。雖然每天都有新的魚友注冊,但是魚友增長的還很緩慢。自從國慶前的文字轉語音的工具上線到現在已經將近有1個月沒有更新小程序了。但是今天終終終終終于又…

31天Python入門——第14天:異常處理

你好,我是安然無虞。 文章目錄 異常處理1. Python異常2. 異常捕獲try-except語句捕獲所有的異常信息獲取異常對象finally塊 3. raise語句4. 自定義異常5. 函數調用里面產生的異常補充練習 異常處理 1. Python異常 Python異常指的是在程序執行過程中發生的錯誤或異…

PyQt6實例_批量下載pdf工具_使用pyinstaller與installForge打包成exe文件

目錄 前置: 步驟: step one 準備好已開發完畢的項目代碼 step two 安裝pyinstaller step three 執行pyinstaller pdfdownload.py,獲取初始.spec文件 step four 修改.spec文件,將data文件夾加入到打包程序中 step five 增加…

Axure項目實戰:智慧城市APP(完整交互匯總版)

親愛的小伙伴,在您瀏覽之前,煩請關注一下,在此深表感謝! 課程主題:智慧城市APP 主要內容:主功能(社保查詢、醫療信息、公交查詢等)、活動、消息、我的頁面匯總 應用場景&#xff…