Spark集群安裝

Spark集群安裝

news/2025/7/9 17:35:06/文章來源:https://zengmiaogen.blog.csdn.net/article/details/72123717

Spark是獨立的，所以集群安裝的時候，不像hive，hbase等需要先安裝hadoop，除非文件保存在hadoop上，才需要安裝hadoop集群。

如果虛擬機安裝，點擊閱讀推薦配置

前提環境：

1、安裝了JDK1.7及以上版本的Linux機器

2、各臺機器間SSH免密碼登錄已配置。

3、各臺Linux防火墻已關閉，時間已同步。

SSH配置教程

時間同步教程

步驟：

1、下載spark安裝包

2、解壓

3、修改spark-env.sh

4、修改 slaves

5、scp -r ?到其他節點

6、start-all.sh 啟動

7、瀏覽器查看

每步詳情

1、下載spark安裝包

http://spark.apache.org/downloads.html

選擇的版本的時候注意安裝的hadoop版本，選擇相應的版本

2、解壓

略

3、修改spark-env.sh

在后面加入

export JAVA_HOME=/jdk1.8.0_73
export SPARK_MASTER_HOST=nbdo1
export SPARK_MASTER_PORT=7077

如果安裝了hadoop，可以配置下

export HADOOP_CONF_DIR=/home/hadoop/hadoop/etc/hadoop

export SPARK_WORKER_CORES=3 ? ? //每個Worker使用的CPU核數
export SPARK_WORKER_INSTANCES=2 ? //每個Slave中啟動幾個Worker實例
export SPARK_WORKER_MEMORY=1G ? ?//每個Worker使用多大的內存
export SPARK_WORKER_WEBUI_PORT=8081 //Worker的WebUI端口號
export SPARK_EXECUTOR_CORES=1 ? ? ? //每個Executor使用使用的核數
export SPARK_EXECUTOR_MEMORY=1G ? ? //每個Executor使用的內存

每臺服務器上，啟動2個worker實例，每個worker用3個cpu核心，1GB內存

worker實例數：機器數*每臺機器上的worker實例數 ? ?

4、修改 slaves

nbdo2

nbdo3

（我有三臺測試機，nbdo1,nbdo2,nbdo3。

nbdo1作為了master了）

5、scp -r ?到其他節點

略

6、start-all.sh 啟動

在master節點上，進入spark安裝目錄的sbin下

[hadoop@nbdo1 sbin]$ ./start-all.sh?

（不要直接輸入 start-all.sh，hadoop啟動腳本也是start-all.sh）

7、瀏覽器查看

ip地址或域名:8080端口訪問

http://nbdo1:8080/

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/news/538594.shtml
繁體地址，請注明出處：http://hk.pswp.cn/news/538594.shtml
英文地址，請注明出處：http://en.pswp.cn/news/538594.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

列表逆序排序_【Python自學筆記】集合——列表

列表逆序排序_【Python自學筆記】集合——列表

list列表類型是一個與元組tuple類似的有序序列。構造函數是list()切片# 切片 fruit ["Apple", "Hawthorn", "Loquat", "Medlar", "Pear", "Quince"] print(fruit[:2]) print(fruit[-1])語法與字符串和元組中的一…

閱讀更多...

esp8266 阿里云 arduino_NUCLEO-G071RB通過WiFi與NB連接阿里云

esp8266 阿里云 arduino_NUCLEO-G071RB通過WiFi與NB連接阿里云

開箱體驗試用背景去年年初，有新項目要讓移動式容器設備的監控數據上云，選型時主要考慮三個系列STM32L0、STM32G0和STM8。最初有意向選用STM32L052RB，主要是為了滿足低功耗需求。恰逢G0系列上市，價格親民，性能卻要高很多…

閱讀更多...

“云上金融，智創未來” 騰訊“云+未來”峰會金融專場在廣州舉行

“云上金融，智創未來” 騰訊“云+未來”峰會金融專場在廣州舉行

5月24日，騰訊“云未來“峰會金融專場在廣州舉行。來自央行、騰訊公司以及銀行、證券、保險、互金公司等騰訊金融云的合作伙伴代表以及行業專家，共同分享了智慧金融、企業數字化轉型、騰訊金融云業務布局以及與合作伙伴取得的最新成績等話題。活動現場&am…

閱讀更多...

Spark算子reduceByKey深度解析

Spark算子reduceByKey深度解析

原文地址：http://blog.csdn.net/qq_23660243/article/details/51435257 -------------------------------------------- 最近經常使用到reduceByKey這個算子，懵逼的時間占據多數，所以沉下心來翻墻上國外的帖子仔細過了一遍，發現一…

閱讀更多...

繞固定軸分解_3軸 / 5軸 / 3+2到底是什么......??

繞固定軸分解_3軸 / 5軸 / 3+2到底是什么......??

一、什么是32定位加工在一個三軸銑削程序執行時，使用五軸機床的兩個旋轉軸將切削刀具固定在一個傾斜的位置，32加工技術的名字也由此而來，這也叫做定位五軸機床，因為第四個軸和第五個軸是用來確定在固定位置上刀具的方向&#xff…

閱讀更多...

unix環境高級編程 pdf_UNIX環境高級編程——記錄鎖

unix環境高級編程 pdf_UNIX環境高級編程——記錄鎖

引言在多進程環境下，多個進程同時讀寫一個文件，如果不進行同步，就可能導致不期待的結果，如后一個進程覆蓋了前一個進程寫的內容。Unix為此提供了一種強大的解決辦法：記錄鎖記錄鎖記錄鎖本質上就是對文件加讀寫鎖&#…

閱讀更多...

LNMP源碼安裝腳本

LNMP源碼安裝腳本

LNMP安裝腳本，腳本環境 #LNMP環境搭建centos6.8 2.6.32-696.28.1.el6.x86_64 nginx:1.12.2 mysql:5.6.36 PHP:5.5.36 #!/bin/bash#LNMP環境搭建centos6.8 2.6.32-696.28.1.el6.x86_64 nginx:1.12.2 mysql:5.6.36 PHP:5.5.36trap echo "error line: $LINE…

閱讀更多...

啟動spark shell

啟動spark shell

spark集群安裝教程：http://blog.csdn.net/zengmingen/article/details/72123717 啟動spark shell. 在spark安裝目錄bin文件夾下 ./spark-shell --master spark://nbdo1:7077 --executor-memory 2g --total-executor-cores 2 參數說明： --master spark…

閱讀更多...

python發送excel文件_Python操作Excel, 開發和調用接口，發送郵件

python發送excel文件_Python操作Excel, 開發和調用接口，發送郵件

接口開發： importflaskimporttoolsimportjson,redisimportrandom server flask.Flask(__name__)#新建一個服務，把當前這個python文件當做一個服務 ip 118.24.3.40passwordHK139bc&*r redis.Redis(hostip,passwordpassword,port6379,db10, decode_res…

閱讀更多...

第一個Spark實例：求PI值

第一個Spark實例：求PI值

向spark提交jar，需要使用 bin下的spark-submit [hadoopnbdo1 bin]$ ./spark-submit --help Usage: spark-submit [options] <app jar | python file> [app arguments] Usage: spark-submit --kill [submission ID] --master [spark://...] Usage: spark-submi…

閱讀更多...

go conn 讀取byte數組后是否要_【技術推薦】正向角度看Go逆向

go conn 讀取byte數組后是否要_【技術推薦】正向角度看Go逆向

Go語言具有開發效率高，運行速度快，跨平臺等優點，因此正越來越多的被攻擊者所使用，其生成的是可直接運行的二進制文件，因此對它的分析類似于普通C語言可執行文件分析，但是又有所不同，本文將會使用…

閱讀更多...

Confluence 6 選擇一個外部數據庫

Confluence 6 選擇一個外部數據庫

2019獨角獸企業重金招聘Python工程師標準>>> 注意： 選擇一個合適的數據庫通常需要花費很多時間。同時 Confluence 自帶的 XML 數據備份和恢復功能通常也不適合合并和備份有大量數據的數據庫。如果你想在系統運行后進行數據合并，你通常需要使用…

閱讀更多...

spark中saveAsTextFile如何最終生成一個文件

spark中saveAsTextFile如何最終生成一個文件

原文地址：http://www.cnblogs.com/029zz010buct/p/4685173.html ----------------------------------------------------------------------- 一般而言，saveAsTextFile會按照執行task的多少生成多少個文件，比如part-00000一直到part-0000n&…

閱讀更多...

python爬取內容亂碼_python爬取html中文亂碼

python爬取內容亂碼_python爬取html中文亂碼

環境： python3.6 爬取代碼： import requests url https://www.dygod.net/html/tv/hytv/ req requests.get(url) print(req.text) 爬取結果： / _-如上，title內容出現亂碼，自己感覺應該是編碼的問題，但是不…

閱讀更多...

前端每日實戰：34# 視頻演示如何用純 CSS 創作在文本前后穿梭的邊框

前端每日實戰：34# 視頻演示如何用純 CSS 創作在文本前后穿梭的邊框

效果預覽按下右側的“點擊預覽”按鈕可以在當前頁面預覽，點擊鏈接可以全屏預覽。 https://codepen.io/comehope/pen/qYepNv 可交互視頻教程此視頻是可以交互的，你可以隨時暫停視頻，編輯視頻中的代碼。請用 chrome, safari, edge 打開觀看。…

閱讀更多...

not support mysql_MYSQL出現quot; Client does not support authentication quot;的解決方法

not support mysql_MYSQL出現quot; Client does not support authentication quot;的解決方法

MYSQL 幫助：A.2.3 Client does not support authentication protocolMySQL 4.1 and up uses an authentication protocol based on a password hashing algorithm that is incompatible with that used by older clients. If you upgrade the server to 4.1, attemp…

閱讀更多...

spark shell中編寫WordCount程序

spark shell中編寫WordCount程序

啟動hdfs 略http://blog.csdn.net/zengmingen/article/details/53006541 啟動spark 略安裝：http://blog.csdn.net/zengmingen/article/details/72123717 spark-shell：http://blog.csdn.net/zengmingen/article/details/72162821準備數據 vi wordcount.t…

閱讀更多...

初級英語02

初級英語02

做客 1 Diana,i havent seen you for ages,how have you been? 2 would you like something to drink? 3 give my best to your parents. 4 did you hear what happened?whats the matter with him? 5 id like to applogize for leaving so early,i brought a little gift,…

閱讀更多...

mysql計算機二級選擇題題庫_全國計算機二級mysql數據庫選擇題及答案

mysql計算機二級選擇題題庫_全國計算機二級mysql數據庫選擇題及答案

全國計算機二級mysql數據庫選擇題及答案選擇題是全國計算機二級mysql考試里的送分題，下面小編為大家帶來了全國計算機二級mysql數據庫選擇題及答案，歡迎大家閱讀！全國計算機二級mysql數據庫選擇題及答案1) 函數 max( ) 表明這是一個什么函數?…

閱讀更多...

git add 撤銷_更科學地管理你的項目，Git 簡明教程（二）

git add 撤銷_更科學地管理你的項目，Git 簡明教程（二）

修改文件內容上回說到，我們已經成功創建并提交了一個 README.md 文件到 FirstGit 版本庫中1、修改文件現在我們更改 README.md 內容2、查看版本庫狀態該文件夾內右鍵運行 Git Bash Here執行命令 git statusGit 提示我們的改動還沒有 commit，并且它給出了…

閱讀更多...

最新文章