如何搭建spark yarn模式的集群

如何搭建spark yarn模式的集群

web/2025/7/7 16:08:35/文章來源:https://blog.csdn.net/Betty_at/article/details/147594894

一、基礎環境準備

?安裝JDK 1.8+?
所有節點需安裝JDK并配置環境變量，確保JAVA_HOME正確指向安裝路徑14。
?部署Hadoop集群?
- 安裝Hadoop（推薦3.x版本），配置YARN資源管理器4。
- 在yarn-site.xml中啟用資源調度：
```
<property>  <name>yarn.resourcemanager.hostname</name>  <value>主節點IP或主機名</value>  
</property>  
```

????????????????設置HADOOP_HOME和HADOOP_CONF_DIR環境變量4。

?安裝Spark?
- 下載與Hadoop兼容的Spark版本（如Spark 3.5.5對應Hadoop 3.x）4。
- 解壓至統一目錄（如/opt/spark），配置SPARK_HOME環境變量4。
  二、Spark集成YARN配置
- ?修改spark-env.sh?
  添加以下配置以關聯Hadoop和YARN：
  bashCopy Code
  
  export JAVA_HOME=/opt/java/jdk8 export HADOOP_HOME=/opt/hadoop/hadoop-3.2.2 export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop export SPARK_DIST_CLASSPATH=$(hadoop classpath) # 動態加載Hadoop類路徑:ml-citation{ref="4" data="citationList"}
- ?配置spark-defaults.conf?
  指定YARN為資源管理器：
  textCopy Code
  
  spark.master yarn spark.yarn.jars hdfs:///spark/jars/* # 可選，將Spark依賴上傳至HDFS:ml-citation{ref="4,8" data="citationList"}
- 三、集群分發與服務啟動
- ?同步配置到所有節點?
  使用scp或集群管理工具（如Ansible）將配置文件和安裝目錄分發至所有工作節點4。
- ?啟動Hadoop與YARN服務?
  - 啟動HDFS：start-dfs.sh
  - 啟動YARN：start-yarn.sh
    確認ResourceManager和NodeManager進程正常4。
- 四、驗證集群部署
- ?提交測試任務到YARN?
  使用spark-submit提交示例程序：
  bashCopy Code
  
  spark-submit --class org.apache.spark.examples.SparkPi \ --master yarn \ $SPARK_HOME/examples/jars/spark-examples_2.12-3.5.5.jar 100
  檢查YARN Web UI（默認端口8088）中任務狀態和日志輸出34。
- ?驗證資源分配?
  確認任務執行后，在YARN監控界面查看資源使用情況（CPU、內存分配）3。
- 五、注意事項
- ?版本兼容性?
  Spark、Hadoop、Scala版本需嚴格匹配（如Spark 3.5.5需Scala 2.12.x和Hadoop 3.3+）48。
- ?網絡與權限?
  - 確保節點間SSH無密碼互通。
  - 防火墻開放YARN相關端口（如ResourceManager的8032、8088端口）4。
- ?依賴管理?
  若將Spark JAR包上傳至HDFS，需提前通過hadoop fs -put命令部署，避免任務運行時重復傳輸4。
- 以上步驟通過整合Hadoop YARN與Spark配置實現集群資源統一管理，適用于生產環境的大規模任務調度。

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/web/77594.shtml
繁體地址，請注明出處：http://hk.pswp.cn/web/77594.shtml
英文地址，請注明出處：http://en.pswp.cn/web/77594.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

python22-元組、列表、字典、集合推導式

python22-元組、列表、字典、集合推導式

課程：B站大學記錄python學習，直到學會基本的爬蟲，使用python搭建接口自動化測試就算學會了，在進階webui自動化，app自動化循環語句小作業元組推導式列表推導式字典推導式實踐是檢驗真理的唯一標準推導式簡介 Pytho…

閱讀更多...

探索 CameraCtrl模型：視頻生成中的精確攝像機控制技術

探索 CameraCtrl模型：視頻生成中的精確攝像機控制技術

在當今的視頻生成領域，精確控制攝像機軌跡一直是一個具有挑戰性的目標。許多現有的模型在處理攝像機姿態時往往忽略了精準控制的重要性，導致生成的視頻在攝像機運動方面不夠理想。為了解決這一問題，一種名為 CameraCtrl 的創新文本到視頻模型…

閱讀更多...

跨端開發技術總結

跨端開發技術總結

1.electron： 基于node.js 桌面端：window / linux / macos 手機端：無頁面：網頁開發相關技術都可以 2.tauri 基于rust 桌面端：window / linux / macos 手機端：android / IOS 頁面：網頁開…

閱讀更多...

單片機-89C51部分：7、中斷

單片機-89C51部分：7、中斷

飛書文檔https://x509p6c8to.feishu.cn/wiki/A5gcwyL5giq1JOkkcsscn8eLnzf 一、中斷的作用中斷是為使單片機具有對外部或內部隨機發生的事件實時處理而設置的，中斷功能的存在，很大程度上提高了單片機處理外部或內部事件的能力。它也是單片機最重要的功…

閱讀更多...

0805登錄_注冊_token_用戶信息_退出-網絡ajax請求2-react-仿低代碼平臺項目

0805登錄_注冊_token_用戶信息_退出-網絡ajax請求2-react-仿低代碼平臺項目

文章目錄 1 JWT1.1 JWT結構1.2 工作流程1.3 優點1.4 缺點1.5 安全實踐1.6. 適用場景1.7 JWT與OAuth2**8. 示例代碼（Node.js）** 2 用戶mock和api3 注冊4 登錄5 token存儲6 請求攔截器設置token6 獲取用戶信息7 退出登錄結語 1 JWT JSON Web Token&#x…

閱讀更多...

大模型入門

大模型入門

一、模型入門路徑 1. 學習預備知識編程語言：熟練掌握Python編程語言，包括基本語法、數據結構（列表、字典、元組等）、面向對象編程、文件操作等。Python有豐富的機器學習和深度學習庫，方便進行大模型的開發和實驗。數…

閱讀更多...

把dll模塊注入到游戲進程的方法_插APC注入

把dll模塊注入到游戲進程的方法_插APC注入

一、概述 APC是異步過程調用，系統創建線程的時候會為線程創建一個APC隊列，當線程調用SleepEx，WaitSingleObjectEx等函數時，并把線程狀態被設置為可提醒狀態時，線程并不會睡眠，而是檢查APC隊列是否為空，如果不為空，轉去執行APC隊列中的每一項，因此給目標進程中的線程插…

閱讀更多...

git 如何清空當前分支的歷史提交記錄，僅保留最后一次提交

git 如何清空當前分支的歷史提交記錄，僅保留最后一次提交

本方法基于新建 Git 孤立分支實現： 1. ??首先檢出待清理的分支在 IDEA 右下角檢查當前分支名稱或執行 git branch 確認。如果不在目標分支上，會顯示 (HEAD detached at xxxxx)，這時需要先切換分支： git checkout 原分支名 2.…

閱讀更多...

【C++】Googletest應用

【C++】Googletest應用

Googletest 1 配置使用cmake配置： 具體文件后面上傳補充 ./test.out --gtest_filterXXXTest.xxx 2 gdb 為了跟蹤流程，可以使用gdb； gdb ./xxx.out gdb --args ./gtest --gtest_filterxxx.xxx設置運行參數 set args --gtest_filterxxx.…

閱讀更多...

JavaScript：從DOM概述到window對象的常見事件

JavaScript：從DOM概述到window對象的常見事件

一、BOM概述 1.BOM的概念 BOM（Browser Object Model）即瀏覽器對象模型，它提供了獨立于內容而與瀏覽器窗口進行交互的對象，其核心對象是window 2.BOM的構成 BOM比DOM更大，它包含DOM window對象是瀏覽器的頂級對象&a…

閱讀更多...

qobject與event事件應用

qobject與event事件應用

int main(int argc, char *argv[]) {QApplication a(argc, argv);MyWidget mainWidget;mainWidget.setWindowTitle("QObject與事件處理示例");mainWidget.resize(200, 200);mainWidget.show();return a.exec(); }QApplication a(argc, argv);：創建 QAppli…

閱讀更多...

QTableView復選框居中

QTableView復選框居中

目錄方法一：QSS方法2:自定義復選框委托類一、構造函數 CheckBoxDelegate()二、paint() 方法三、editorEvent() 方法四、關鍵設計要點五、擴展應用場景六、代碼示例（補充） 方法一：QSS QTableView::indicator {position: relative…

閱讀更多...

基于QT的仿QQ音樂播放器

基于QT的仿QQ音樂播放器

一、項目介紹該項目是基于QT開發的?樂播放軟件，界面友好，功能豐富，主要功能如下： 窗口hand部分： 點擊最小化按鈕，窗口最小化點擊最大化按鈕，窗口最大化點擊關閉按鈕，程序退出 …

閱讀更多...

SQL知識點合集---第二彈

SQL知識點合集---第二彈

數據一 <select id"listPositionAuditCheckSample" resultType"net.nxe.cloud.content.server.entity.PositionAuditCheckSample"><trim prefixOverrides"union all"><if test"userSampleCount ! null and userSampleCount…

閱讀更多...

【QT】QT控制硬件

【QT】QT控制硬件

QT控制硬件 1.上位機程序開發2.具體例子控制led燈3. linux中的函數跟QT類里面的函數同名，發生沖突4.示例代碼 1.上位機程序開發 QT做一個上位機程序，控制底層的硬件設備(下位機) 總結： 在構造函數里面去初始化，打開硬件驅動在析…

閱讀更多...

Flutter介紹、Flutter Windows Android 環境搭建真機調試

Flutter介紹、Flutter Windows Android 環境搭建真機調試

目錄 Flutter介紹 Windows 環境搭建 1.安裝配置JDK 2.下載安裝Android Studio 3.下載配置Flutter SDK ?4.運行Flutter doctor命令檢測環境是否配置成功 ?5.打開Android Studio安裝Flutter/Dart 插件 ?6.插件運行Flutter項目 ?編輯 Flutter Android真機調試 Flut…

閱讀更多...

Android Studio 中使用 SQLite 數據庫開發完整指南（Kotlin版本）

Android Studio 中使用 SQLite 數據庫開發完整指南（Kotlin版本）

文章目錄 1. 項目準備1.1 創建新項目1.2 添加必要依賴 2. 數據庫設計3. 實現數據庫3.1 創建實體類 (Entity)3.2 創建數據訪問對象 (DAO)3.3 創建數據庫類 4. 創建 Repository5. 創建 ViewModel6. 實現 UI 層6.1 創建筆記列表 Activityactivity_notes_list.xmlNotesListActivity…

閱讀更多...

Vue基礎(7)_計算屬性

Vue基礎(7)_計算屬性

計算屬性(computed) 一、使用方式： 1.定義計算屬性： 在Vue組件中，通過在 computed 對象中定義計算屬性名稱及對應的計算函數來創建計算屬性。計算函數會返回計算屬性的值。 2.在模板中使用計算屬性： 在Vue的模板中，您…

閱讀更多...

辛格迪客戶案例 | 華道生物細胞治療生產及追溯項目(CGTS)

辛格迪客戶案例 | 華道生物細胞治療生產及追溯項目(CGTS)

01 華道（上海）生物醫藥有限公司：細胞治療領域的創新先鋒華道（上海）生物醫藥有限公司（以下簡稱“華道生物”）是一家專注于細胞治療技術研發與應用的創新型企業，尤其在CAR-T細胞免疫…

閱讀更多...

[26] cuda 應用之 nppi 實現圖像格式轉換

[26] cuda 應用之 nppi 實現圖像格式轉換

[26] cuda 應用之 nppi 實現圖像格式轉換講述 nppi 接口定義通過nppi實現 bayer 格式轉rgb格式官網參考信息：http://gwmodel.whu.edu.cn/docs/CUDA/npp/group__image__color__debayer.html#details1. 接口定義官網關于轉換的原理是這么寫的： Grayscale Color Filter Array …

閱讀更多...

最新文章