CentOS7下Spark集群的安裝

從物理部署層面上來看，Spark主要分為兩種類型的節點，Master節點和Worker節點，Master節點主要運行集群管理器的中心化部分，所承載的作用是分配Application到Worker節點，維護Worker節點，Driver，Application的狀態。Worker節點負責具體的業務運行。

從Spark程序運行的層面來看，Spark主要分為驅動器節點和執行器節點。

這里寫圖片描述

1、機器準備

準備兩臺以上Linux服務器，安裝好JDK1.8

我這里的是

ip地址	系統
Carlota1	CentOS7.3
Carlota2	CentOS7.3
Carlota3	CentOS7.3

2、下載Spark安裝包

http://spark.apache.org/downloads.html

3、上傳解壓

//上傳
scp spark-3.0.1-bin-hadoop3.2.tgz root@Carlota1:/usr/local/apps/
scp spark-3.0.1-bin-hadoop3.2.tgz root@Carlota2:/usr/local/apps/
scp spark-3.0.1-bin-hadoop3.2.tgz root@Carlota3:/usr/local/apps/

//解壓
tar -zxvf spark-3.0.1-bin-hadoop3.2.tgz

//改個名
mv spark-3.0.1-bin-hadoop3.2 spark-3.0.1

4、配置環境變量

vi /etc/profile

#Spark
export SPARK_HOME=/usr/local/apps/spark-3.0.1
export PATH=$PATH:$SPARK_HOME/bin:$SPARK_HOME/sbin

source /etc/profile

5、配置Spark【Standalone模式】

Spark的部署模式有Local、Local-Cluster、Standalone、Yarn、Mesos，我們選擇最具代表性的Standalone集群部署模式。

進入到Spark安裝目錄cd /usr/local/apps/spark-3.0.1/conf
將slaves.template復制為slavescp slaves.template slaves
將spark-env.sh.template復制為spark-env.shcp spark-env.sh.template spark-env.sh
修改slaves文件，將work的hostname輸入vi slaves

Carlota2
Carlota3

修改spark-env.sh文件vi spark-env.sh，添加如下配置：

SPARK_MASTER_HOST=Cralota1
SPARK_MASTER_PORT=7077

同步數據到Carlota2和Carlota3

scp -r conf root@Carlota2:/usr/local/apps/spark-3.0.1
scp -r conf root@Carlota3:/usr/local/apps/spark-3.0.1

進入sbin目錄
vi spark-config.sh在下方添加

JAVA_HOME=/usr/local/java/jdk1.8

同步一下

scp -r spark-config.sh root@Carlota2:/usr/local/apps/spark-3.0.1/sbin
scp -r spark-config.sh root@Carlota3:/usr/local/apps/spark-3.0.1/sbin

Spark集群配置完畢，目前是1個Master，2個Wor

6、Spark啟動集群

Carlota1上啟動集群./sbin/start-all.sh

[root@Carlota1 spark-3.0.1]# ./sbin/start-all.sh starting org.apache.spark.deploy.master.Master, logging to /usr/local/apps/spark-3.0.1/logs/spark-root-org.apache.spark.deploy.master.Master-1-Carlota1.outCarlota2: starting org.apache.spark.deploy.worker.Worker, logging to /usr/local/apps/spark-3.0.1/logs/spark-root-org.apache.spark.deploy.worker.Worker-1-Carlota2.outCarlota3: starting org.apache.spark.deploy.worker.Worker, logging to /usr/local/apps/spark-3.0.1/logs/spark-root-org.apache.spark.deploy.worker.Worker-1-Carlota3.out

啟動后執行jps命令，主節點上有Master進程，其他子節點上有Work進行

[root@Carlota1 spark-3.0.1]# jps
10551 Master
10603 Jps

[root@Carlota3 spark-3.0.1]# jps
17085 Jps
16959 Worker

登錄Spark管理界面查看集群狀態（主節點）：http://Carlota1:8080/

在這里插入圖片描述

到此為止，Spark集群安裝完畢.

注意：如果遇到 “JAVA_HOME not set” 異常，可以在sbin目錄下的spark-config.sh 文件中加入如下配置：
export JAVA_HOME=XXXX

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/news/535671.shtml
繁體地址，請注明出處：http://hk.pswp.cn/news/535671.shtml
英文地址，請注明出處：http://en.pswp.cn/news/535671.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！