配置Spark歷史服務器,輕松查看任務記錄

在大數據處理中,Spark是一個強大的分布式計算框架。但當Spark服務重啟后,之前的運行記錄就會消失,給我們排查問題和分析任務執行情況帶來不便。這時,配置Spark歷史服務器就顯得尤為重要,它能幫助我們保存和查看歷史任務記錄。下面就來詳細介紹如何配置Spark歷史服務器。

一、準備工作

在開始配置之前,需要確保HDFS服務處于開啟狀態,因為我們會把歷史任務的記錄保存在HDFS集群文件中。

二、具體配置步驟

?????????1. 停止Spark集群

????????????????進入`/opt/module/spark - standalone/sbin`目錄,運行命令`./stop - all.sh`,停止當前正在運行的Spark集群。這一步是為了在后續修改配置文件時,避免出現沖突。

?????????2. 修改spark - default.conf文件

????????????????找到`/opt/module/spark - standalone/conf/spark - default.conf.template`文件,將其名稱修改為`spark - default.conf` 。

????????????????然后在文件中補充以下兩個設置: ``` spark.eventLog.enabled true spark.eventLog.dir hdfs://hadoop100:8020/directory ```

????????????????這里`spark.eventLog.enabled`設置為`true`,表示啟用事件日志記錄功能;`spark.eventLog.dir`指定了歷史任務相關信息的保存目錄,是HDFS上的`/directory`文件夾 。

????????????????需要注意的是,要確保這個目錄存在,并且HDFS服務正常運行。

?????????3. 啟動HDFS服務并創建目錄

????????????????運行`start - dfs.sh`啟動Hadoop的HDFS服務。

????????????????可以通過命令行(如`hdfs dfs - mkdir - p hdfs://hadoop100:8020/directory` )或者在`hadoop100:9870`的Web頁面操作來創建`directory`目錄。?

???????? 4. 修改spark - env.sh文件

????????????????在`spark - env.sh`文件中添加以下配置: ``` export SPARK_HISTORY_OPTS="-Dspark.history.fs.logDirectory=hdfs://hadoop100:8020/directory" ``` 這一步是為歷史服務器指定日志存儲目錄,使其能夠正確讀取和展示任務歷史記錄。

? ? ? ???5. 分發配置文件

????????????????使用`xsync /opt/module/spark - standalone/conf/`命令,將修改后的配置文件分發到集群中的其他機器上,保證整個集群配置的一致性。?

???????? 6. 重新啟動Spark集群

????????????????在`/opt/module/spark - standalone/sbin`目錄下,運行`./start - all.sh`命令,重新啟動Spark集群。

?????????7. 啟動歷史服務器

????????????????在相同目錄下,運行`./start - history - server.sh`命令,啟動Spark歷史服務器。啟動后,可以檢查`spark - standalone/logs`目錄下的日志,查看歷史服務器的啟動情況是否正常。

?????????8. 查看效果

????????????????此時,通過瀏覽器訪問`hadoop100:18080`端口,正常情況下應該暫時看不到任務記錄,因為還沒有提交新的任務。

???????? 9. 驗證配置

????????????????重新提交一個新的Spark任務,然后再次回到`hadoop100:18080`端口對應的頁面,這時就應該能夠看到剛剛提交的任務記錄了。?

三、總結

通過以上一系列步驟,我們成功配置了Spark歷史服務器。這樣在后續的工作中,無論是排查任務執行失敗的原因,還是分析任務的運行效率,都可以方便地通過歷史服務器查看相關記錄,大大提高了工作效率,也讓我們對Spark任務的管理更加得心應手。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/903240.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/903240.shtml
英文地址,請注明出處:http://en.pswp.cn/news/903240.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

(六)RestAPI 毛子(外部導入打卡/游標分頁/Refit/Http resilience/批量提交/Quartz后臺任務/Hateoas Driven)

文章目錄 項目地址一、外部導入打卡功能1.1 創建實體1. Entry實體2. EntryImport實體3. 添加數據庫配置4. 創建表 1.2 創建DTOs1.3 創建GetEnties Controller 二、游標分頁2.1 創建所需要的DTOs1. 創建游標分頁的請求參數2. 創建CollectionResponse3. 添加游標編碼和解碼的DTO …

Node.js CSRF 保護指南:示例及啟用方法

解釋 CSRF 跨站請求偽造 (CSRF/XSRF) 是一種利用用戶權限劫持會話的攻擊。這種攻擊策略允許攻擊者通過誘騙用戶以攻擊者的名義提交惡意請求,從而繞過我們的安全措施。 CSRF 攻擊之所以可能發生,是因為兩個原因。首先,CSRF 攻擊利用了用戶無法辨別看似合法的 HTML 元素是否…

Flink介紹——實時計算核心論文之Dataflow論文總結

數據流處理的演變與 Dataflow 模型的革新 在大數據處理領域,流式數據處理系統的發展歷程充滿了創新與變革。從早期的 S4 到 Storm,再到 MillWheel,每一個系統都以其獨特的方式推動了技術的進步。S4 以其無中心架構和 PE(Processi…

Arduino 入門學習筆記(五):KEY實驗

Arduino 入門學習筆記(五):KEY實驗 開發板:正點原子ESP32S3 例程源碼在文章頂部可免費下載(審核中…) 1. GPIO 輸入功能使用 1.1 GPIO 輸入模式介紹 在上一文章中提及到 pinMode 函數, 要對…

Centos9安裝docker

1. 卸載docker 查看是否安裝了docker yum list | grep docker卸載老版本docker,拷貝自官網 sudo yum remove docker \docker-client \docker-client-latest \docker-common \docker-latest \docker-latest-logrotate \docker-logrotate \docker-engine卸載新版本…

Pgvector+R2R搭建RAG知識庫

背景 R2R是一個采用Python編寫的開源AI RAG框架項目,與PostgreSQL技術棧集成度高,運行需求資源少(主要是本人的Macbook air m1內存只有8G)的特點,對部署本地私有化化AI RAG應用友好。 Resource Recommendations Whe…

go中redis使用的簡單介紹

目錄 一、Redis 簡介 二、Go中Redis的使用 1. 安裝Go Redis包 2. 單機模式 連接示例 3. 哨兵模式 依賴 連接示例 三、Redis集群 1. 集群模式 集群部署 部署結構 使用redis-cli創建集群 連接示例 四、常用數據結構與操作 1. 字符串(String&#xff0…

北京工業大學25計專上岸經驗分享

1.個人情況介紹 本科就讀于河北雙非,專業為計算機科學與技術,四級三次498,六級兩次460,拿過幾次校級獎學金,競賽經歷有藍橋杯國三、數學競賽省二。本科成績排名靠前,保研保7排8,遺憾選擇考研繼…

在 Ubuntu 24.04 系統上安裝和管理 Nginx

1、安裝Nginx 在Ubuntu 24.04系統上安裝Nginx,可以按照下面的步驟進行: 1.1、 更新系統軟件包列表 在安裝新軟件之前,需要先更新系統的軟件包列表,確保獲取到最新的軟件包信息。打開終端,執行以下命令: …

HarmonyOS4+NEXT星河版入門與項目實戰(26)-----版本控制與代碼托管

引言 隨著移動應用開發技術的不斷進步,華為推出的鴻蒙操作系統(HarmonyOS)以及其配套的集成開發環境DevEco Studio逐漸成為開發者關注的焦點。對于新手開發者來說,掌握版本控制和代碼托管不僅是提高工作效率的關鍵,也是團隊協作的重要基礎。本文將介紹如何在使用DevEco S…

利用Arcgis自己繪制shp文件

1.選擇自己想要創建的shp文件的位置 我是直接創建在連接文件夾中 2.右鍵-新建-shp 3.設置名稱、要素類型、空間參考 4、點擊創建要素 5、右側選擇圖層、創建面 6、開始繪制,雙擊任意位置結束繪制 之后可以改一下shp文件的名字

【C/C++】深入理解指針(六)

文章目錄 深入理解指針(六)1.sizeof和strlen的對比1.1 sizeof1.2 strlen1.3 sizeof和strlen的對? 2.數組和指針筆試題解析2.1 ?維數組2.2 字符數組代碼1:代碼2:代碼3:代碼4:代碼5:代碼6: 2.3 ?維數組 3.…

探索大語言模型(LLM):語言模型從海量文本中無師自通

文章目錄 引言:當語言模型學會“自己教自己”一、自監督學習:從“無標簽”中挖掘“有監督”信號二、語言模型的自監督訓練范式:兩大經典路徑1. 掩碼語言模型(Masked Language Modeling, MLM)——以BERT為例2. 自回歸語…

2025.5.4機器學習筆記:PINN文獻閱讀

2025.5.4周報 文獻閱讀題目信息摘要創新點網絡架構實驗結論不足以及展望 文獻閱讀 題目信息 題目: Physics-Informed Neural Network Approach for Solving the One-Dimensional Unsteady Shallow-Water Equations in Riverine Systems期刊: Journal o…

Unity Post Processing 小記 【使用泛光實現燈光亮度效果】

一、前言 本篇適用于Unity 2018 - 2019及以上版本,以默認渲染管線為例。文章內容源于個人研究嘗試與網絡資料收集,可能存在不準確之處。初衷是因新版本制作時老的Bloom插件失效,經研究后分享開啟Bloom效果的方法。若在項目中使用Post Proces…

牟乃夏《ArcGIS Engine地理信息系統開發教程》學習筆記3-地圖基本操作與實戰案例

目錄 一、開發環境與框架搭建 二、地圖數據加載與文檔管理 1. 加載地圖文檔(MXD) 2. 動態添加數據源 三、地圖瀏覽與交互操作 1. 基礎導航功能 2. 書簽管理 3. 量測功能 四、要素選擇與屬性查詢 1. 屬性查詢 2. 空間查詢 五、視圖同步與鷹眼…

Qt指ModbusTcp協議的使用

Modbus 是一套通信“語言”(協議),而 RS485 / RS232 / TCP 是通信“管道”(物理接口)。 編寫modubusTcp程序,避免不了調試,首先用到的兩個工具助手 poll是主機,slave是從機。主機也就是發送數據…

探索大語言模型(LLM):自監督學習——從數據內在規律中解鎖AI的“自學”密碼

文章目錄 自監督學習:從數據內在規律中解鎖AI的“自學”密碼一、自監督學習的技術內核:用數據“自問自答”1. 語言建模:預測下一個單詞2. 掩碼語言模型(MLM):填補文本空缺3. 句子順序預測(SOP&a…

CentOS7.9安裝Python 3.10.11并包含OpenSSL1.1.1t

1. 安裝編譯 Python 所需的依賴包 yum -y install gcc make zlib-devel bzip2-devel openssl-devel ncurses-devel sqlite-devel readline-devel tk-devel libffi-devel wget2. 安裝 OpenSSL 1.1.1 或更新版本 (自定義路徑安裝的 OpenSSL 1.1.1 不會影響系統原有的…

qt事件過濾與傳遞機制

當點擊 QLabel 時,正常情況下并不會直接觸發 MyWidget 的 mousePressEvent 函數,原因在于事件的傳遞機制和事件過濾器的存在。下面詳細分析這個過程: 事件傳遞機制 在 Qt 里,事件的傳遞是從子控件往父控件冒泡的。不過&#xff…