大數據技術-Hadoop（一）Hadoop集群的安裝與配置

大數據技術-Hadoop（一）Hadoop集群的安裝與配置

web/2025/9/3 7:26:00/文章來源:https://blog.csdn.net/weixin_39555954/article/details/144680951

目錄

一、準備工作

1、安裝jdk（每個節點都執行）

2、修改主機配置?（每個節點都執行）

3、配置ssh無密登錄?（每個節點都執行）

二、安裝Hadoop（每個節點都執行）

三、集群啟動配置（每個節點都執行）

1、core-site.xml

2、hdfs-site.xml

3、yarn-site.xml?

4、mapred-site.xml

5、workers

四、啟動集群和測試（每個節點都執行）

1、配置java環境

2、指定root啟動用戶?

3、啟動

3.1、如果集群是第一次啟動

3.2、啟動HDFS 在hadoop1節點

3.3、啟動YARN在配置ResourceManager的hadoop2節點

3.4、查看 HDFS的NameNode

3.5、查看YARN的ResourceManager

4、測試

?4.1、測試

?4.2、文件存儲路徑

?4.3、統計文本個數

五、配置Hadoop腳本

1、啟動腳本hadoop.sh

2、查看進程腳本jpsall.sh

3、拷貝到其他服務器

一、準備工作

	hadoop1	hadoop2	hadoop3
IP	192.168.139.176	192.168.139.214	192.168.139.215
HDFS	NameNode DataNode	DataNode	SecondaryNameNode DataNode
YARN	NodeManager	ResourceManager NodeManager	NodeManager

1、安裝jdk（每個節點都執行）

tar -zxf jdk-8u431-linux-x64.tar.gz
mv jdk1.8.0_431 /usr/local/java#進入/etc/profile.d目錄
vim java_env.sh#編輯環境變量
#java
JAVA_HOME=/usr/local/java
JRE_HOME=/usr/local/java/jre
CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar:$JRE_HOME/lib
PATH=$JAVA_HOME/bin:$PATH
export PATH JAVA_HOME CLASSPATH#刷新
source /etc/profile

2、修改主機配置?（每個節點都執行）

vim /etc/hosts192.168.139.176 hadoop1
192.168.139.214 hadoop2
192.168.139.215 hadoop3#修改主機名(每個節點對應修改）
vim /etc/hostname 
hadoop1

注意：這里本地的host文件也要修改一下，后面訪問配置的是主機名，如果不配置，需修改為ip

3、配置ssh無密登錄?（每個節點都執行）

#生成密鑰
ssh-keygen -t rsa#復制到其他節點
ssh-copy-id hadoop1
ssh-copy-id hadoop2
ssh-copy-id hadoop3

二、安裝Hadoop（每個節點都執行）

tar -zxf hadoop-3.4.0.tar.gz
mv hadoop-3.4.0 /usr/local/#配置環境變量進入/etc/profile.d目錄vim hadoop_env.sh#添加如下內容
#hadoop
export HADOOP_HOME=/usr/local/hadoop-3.4.0
export PATH=$PATH:$HADOOP_HOME/bin
export PATH=$PATH:$HADOOP_HOME/sbin#查看版本
hadoop version

三、集群啟動配置（每個節點都執行）

修改/usr/local/hadoop-3.4.0/etc/hadoop目錄下

1、core-site.xml

<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<!--Licensed under the Apache License, Version 2.0 (the "License");you may not use this file except in compliance with the License.You may obtain a copy of the License athttp://www.apache.org/licenses/LICENSE-2.0Unless required by applicable law or agreed to in writing, softwaredistributed under the License is distributed on an "AS IS" BASIS,WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.See the License for the specific language governing permissions andlimitations under the License. See accompanying LICENSE file.
--><!-- Put site-specific property overrides in this file. --><configuration><!-- 指定NameNode的地址 --><property><name>fs.defaultFS</name><value>hdfs://hadoop1:8020</value></property><!-- 指定hadoop數據的存儲目錄 --><property><name>hadoop.tmp.dir</name><value>/usr/local/hadoop-3.4.0/data</value></property><!-- 配置HDFS網頁登錄使用的靜態用戶為root ,實際生產請創建新用戶--><property><name>hadoop.http.staticuser.user</name><value>root</value></property></configuration>

2、hdfs-site.xml

<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<!--Licensed under the Apache License, Version 2.0 (the "License");you may not use this file except in compliance with the License.You may obtain a copy of the License athttp://www.apache.org/licenses/LICENSE-2.0Unless required by applicable law or agreed to in writing, softwaredistributed under the License is distributed on an "AS IS" BASIS,WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.See the License for the specific language governing permissions andlimitations under the License. See accompanying LICENSE file.
--><!-- Put site-specific property overrides in this file. --><configuration>
<!-- nn web端訪問地址--><property><name>dfs.namenode.http-address</name><value>hadoop1:9870</value></property><!-- 2nn web端訪問地址--><property><name>dfs.namenode.secondary.http-address</name><value>hadoop3:9868</value></property></configuration>

3、yarn-site.xml?

<?xml version="1.0"?>
<!--Licensed under the Apache License, Version 2.0 (the "License");you may not use this file except in compliance with the License.You may obtain a copy of the License athttp://www.apache.org/licenses/LICENSE-2.0Unless required by applicable law or agreed to in writing, softwaredistributed under the License is distributed on an "AS IS" BASIS,WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.See the License for the specific language governing permissions andlimitations under the License. See accompanying LICENSE file.
-->
<configuration><!-- Site specific YARN configuration properties --><!-- 指定MR走shuffle --><property><name>yarn.nodemanager.aux-services</name><value>mapreduce_shuffle</value></property><!-- 指定ResourceManager的地址--><property><name>yarn.resourcemanager.hostname</name><value>hadoop2</value></property><!-- 環境變量的繼承 --><property><name>yarn.nodemanager.env-whitelist</name><value>JAVA_HOME,HADOOP_COMMON_HOME,HADOOP_HDFS_HOME,HADOOP_CONF_DIR,CLASSPATH_PREPEND_DISTCACHE,HADOOP_YARN_HOME,HADOOP_HOME,PATH,LANG,TZ,HADOOP_MAPRED_HOME</value></property><!-- 開啟日志聚集功能 --><property><name>yarn.log-aggregation-enable</name><value>true</value></property><!-- 設置日志聚集服務器地址 --><property><name>yarn.log.server.url</name><value>http://hadoop102:19888/jobhistory/logs</value></property><!-- 設置日志保留時間為7天 --><property><name>yarn.log-aggregation.retain-seconds</name><value>604800</value></property>
</configuration>

4、mapred-site.xml

<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<!--Licensed under the Apache License, Version 2.0 (the "License");you may not use this file except in compliance with the License.You may obtain a copy of the License athttp://www.apache.org/licenses/LICENSE-2.0Unless required by applicable law or agreed to in writing, softwaredistributed under the License is distributed on an "AS IS" BASIS,WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.See the License for the specific language governing permissions andlimitations under the License. See accompanying LICENSE file.
-->
<!-- Put site-specific property overrides in this file. -->
<configuration><!-- 指定MapReduce程序運行在Yarn上 --><property><name>mapreduce.framework.name</name><value>yarn</value></property><!-- 歷史服務器端地址 --><property><name>mapreduce.jobhistory.address</name><value>hadoop1:10020</value></property><!-- 歷史服務器web端地址 --><property><name>mapreduce.jobhistory.webapp.address</name><value>hadoop1:19888</value></property>
</configuration>

5、workers

hadoop1
hadoop2
hadoop3注意：該文件中添加的內容結尾不允許有空格，文件中不允許有空行

四、啟動集群和測試（每個節點都執行）

1、配置java環境

#修改這個文件/usr/local/hadoop/etc/hadoop/hadoop-env.shexport JAVA_HOME=/usr/local/java

2、指定root啟動用戶?

#在start-dfs.sh，stop-dfs.sh 添加如下內容 方法上面HDFS_DATANODE_USER=root
HADOOP_SECURE_DN_USER=hdfs
HDFS_NAMENODE_USER=root
HDFS_SECONDARYNAMENODE_USER=root在 start-yarn.sh stop-yarn.sh 添加如下內容 方法上面
YARN_RESOURCEMANAGER_USER=root
YARN_NODEMANAGER_USER=root

注：hadoop默認情況下的是不支持root賬戶啟動的，在實際生產請創建用戶組和用戶，并且授予該用戶root的權限

3、啟動

3.1、如果集群是第一次啟動

需要在hadoop1節點格式化NameNode（注意：格式化NameNode，會產生新的集群id，導致NameNode和DataNode的集群id不一致，集群找不到已往數據。如果集群在運行過程中報錯，需要重新格式化NameNode的話，一定要先停止namenode和datanode進程，并且要刪除所有機器的data和logs目錄，然后再進行格式化。）

hdfs namenode -format

3.2、啟動HDFS 在hadoop1節點

/usr/local/hadoop-3.4.0/sbin/start-dfs.sh

3.3、啟動YARN在配置ResourceManager的hadoop2節點

/usr/local/hadoop-3.4.0/sbin/start-yarn.sh

3.4、查看 HDFS的NameNode

http://192.168.139.176:9870/

?

3.5、查看YARN的ResourceManager

http://192.168.139.214:8088

?

4、測試

4.1、測試

#創建文件
hadoop fs -mkdir /input#創建文件
touch text.txt#上傳文件
hadoop fs -put  text.txt /input#刪除
hadoop fs -rm -r /output

?

?4.2、文件存儲路徑

/usr/local/hadoop-3.4.0/data/dfs/data/current/BP-511066843-192.168.139.176-1734965488199/current/finalized/subdir0/subdir0

?4.3、統計文本個數

hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-3.4.0.jar wordcount /input ?/output

五、配置Hadoop腳本

1、啟動腳本hadoop.sh

#!/bin/bashif [ $# -lt 1 ]
thenecho "No Args Input..."exit ;
ficase $1 in
"start")echo " =================== 啟動 hadoop集群 ==================="echo " --------------- 啟動 hdfs ---------------"ssh hadoop1 "/usr/local/hadoop-3.4.0/sbin/start-dfs.sh"echo " --------------- 啟動 yarn ---------------"ssh hadoop2 "/usr/local/hadoop-3.4.0/sbin/start-yarn.sh"echo " --------------- 啟動 historyserver ---------------"ssh hadoop1 "/usr/local/hadoop-3.4.0/bin/mapred --daemon start historyserver"
;;
"stop")echo " =================== 關閉 hadoop集群 ==================="echo " --------------- 關閉 historyserver ---------------"ssh hadoop1 "/usr/local/hadoop-3.4.0/bin/mapred --daemon stop historyserver"echo " --------------- 關閉 yarn ---------------"ssh hadoop2 "/usr/local/hadoop-3.4.0/sbin/stop-yarn.sh"echo " --------------- 關閉 hdfs ---------------"ssh hadoop1 "/usr/local/hadoop-3.4.0/sbin/stop-dfs.sh"
;;
*)echo "Input Args Error..."
;;
esac

#授權
chmod +x hadoop.sh

2、查看進程腳本jpsall.sh

#!/bin/bashfor host in hadoop1 hadoop2 hadoop3
doecho =============== $host ===============ssh $host jps 
done

3、拷貝到其他服務器

scp root@hadoop1:/usr/local/hadoop-3.4.0 hadoop.sh jpsall.sh root@hadoop2:/usr/local/hadoop-3.4.0/scp root@hadoop1:/usr/local/hadoop-3.4.0 hadoop.sh jpsall.sh root@hadoop3:/usr/local/hadoop-3.4.0/

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/web/64409.shtml
繁體地址，請注明出處：http://hk.pswp.cn/web/64409.shtml
英文地址，請注明出處：http://en.pswp.cn/web/64409.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

PilotGo

PilotGo

title: 解鎖 PilotGo：智能化運維的得力助手 date: ‘2024-12-29’ category: blog tags: PilotGo運維管理智能化工具技術應用 sig: ops archives: ‘2024-12’ author:way_back summary: PilotGo 作為一款創新的運維管理工具，憑借其智能化的特性和豐富的…

閱讀更多...

折騰日記：如何讓吃灰筆記本發揮余熱——搭建一個相冊服務

折騰日記：如何讓吃灰筆記本發揮余熱——搭建一個相冊服務

背景之前寫過，我在家里用了一臺舊的工作站筆記本做了服務器，連上一個綠聯的5位硬盤盒實現簡單的網盤功能，然而，還是覺的不太理想，比如使用filebrowser雖然可以備份文件和圖片，當使用手機使用網頁&#xf…

閱讀更多...

使用seata實現分布式事務管理

使用seata實現分布式事務管理

配置版本說明：springCloud Alibaba組件版本關系我用的是spring cloud Alibaba 2.2.1.RELEASE 、springboot 2.2.1.RELEASE、nacos 2.0.1、seata1.2.0,jdk1.8 seata 主要用于在分布式系統中對數據庫進行事務回滾，保證全局事務的一致性。 seata的使用…

閱讀更多...

【總結】動態規劃

【總結】動態規劃

線性dp LeetCode題單， 從記憶化搜索到遞推 Pre： 從最初狀態到最終狀態等價，那么從最終狀態開始和最初狀態開始結果一樣。遞歸時不會產生其他負面結果，即無論何時進入遞歸，只要遞歸參數相同，結果就相同。 …

閱讀更多...

RabbitMQ中的異步Confirm模式：提升消息可靠性的利器

RabbitMQ中的異步Confirm模式：提升消息可靠性的利器

在現代分布式系統中，消息隊列（Message Queue）扮演著至關重要的角色，它能夠解耦系統組件、提高系統的可擴展性和可靠性。RabbitMQ作為一款廣泛使用的消息隊列中間件，提供了多種機制來確保消息的可靠傳遞。其中&#xff…

閱讀更多...

買賣預測工具

買賣預測工具

設計一個用于在交易市場中尋找確定性或大概率盈利的買賣預測工具是一個具有挑戰性但非常有潛力的項目。你可以通過以下幾個步驟進行思路規劃： 1. 明確目標大概率盈利：工具的目的是找出大概率盈利的交易機會。不能完全依賴于100%確定性，因為…

閱讀更多...

【數據結構】數據結構簡要介紹

【數據結構】數據結構簡要介紹

數據結構是計算機科學中用于組織、管理和存儲數據的方式，以便于高效地訪問和修改數據。數據結構的分類： 數據結構可以大致分為兩類：線性結構和非線性結構。 1. 線性結構線性結構中的數據按順序排列，每個元素有唯一的前驅和后…

閱讀更多...

note 41:賬務系統開發規范

note 41:賬務系統開發規范

目錄系統設計防重控制流量控制并發控制異常處理備份機制系統開發??????? 前端隊列操作外系統交互 ?????????????? 系統設計防重控制對于進入到系統中的數據（文件導入、手工錄入、系統直連等）以及本系統發往外…

閱讀更多...

Circular Spanning Tree（樹的性質）

Circular Spanning Tree（樹的性質）

Circular Spanning Tree 本道題目加深理解樹的性質： 思路： 首先考慮什么情況是NO，那么不難想當字符串全是0的時候一定是不行的，因為這樣就構成環了，還有一種情況是1的個數為奇數的時候是不行的，一棵樹中為…

閱讀更多...

linux安裝nginxs報錯：openssl not found

linux安裝nginxs報錯：openssl not found

系統： linux 版本：centOS7 nginx版本：nginx-1.20.2 linux安裝nginx時執行下面命令時報錯： ./configure --with-http_stub_status_module --with-http_ssl_module --prefix/usr/local/nginxchecking for OpenSSL library ... not …

閱讀更多...

【論文筆記】Contrastive Learning for Sign Language Recognition and Translation

【論文筆記】Contrastive Learning for Sign Language Recognition and Translation

🍎個人主頁：小嗷犬的個人主頁 🍊個人網站：小嗷犬的技術小站 🥭個人信條：為天地立心，為生民立命，為往圣繼絕學，為萬世開太平。基本信息標題: Contrastive Learning for…

閱讀更多...

docker redis安裝

docker redis安裝

一.鏡像拉取 docker pull redis:5.0新建文件 touch /home/redis/redis.conf touch /home/redis/redis_6379.pid # bind 192.168.1.100 10.0.0.1 # bind 127.0.0.1 ::1 #bind 127.0.0.1protected-mode noport 6379tcp-backlog 511requirepass roottimeout 0tcp-keepali…

閱讀更多...

【CSS in Depth 2 精譯_096】16.4：CSS 中的三維變換 + 16.5：本章小結

【CSS in Depth 2 精譯_096】16.4：CSS 中的三維變換 + 16.5：本章小結

當前內容所在位置（可進入專欄查看其他譯好的章節內容） 第五部分添加動效 ??【第 16 章變換】 ?? 16.1 旋轉、平移、縮放與傾斜 16.1.1 變換原點的更改16.1.2 多重變換的設置16.1.3 單個變換屬性的設置 16.2 變換在動效中的應用 16.2.1 放大圖標&am…

閱讀更多...

小程序租賃系統開發的優勢與實踐探索

小程序租賃系統開發的優勢與實踐探索

內容概要小程序租賃系統開發正在引起廣泛關注，特別是在數字化快速發展的今天。很多企業開始意識到，小程序不僅能為他們帶來更多的客戶，還能極大地提高管理效率。借助小程序，用戶在租賃時可以更加方便地瀏覽和選擇產品&#xff0…

閱讀更多...

機器人C++開源庫The Robotics Library (RL)使用手冊（二）

機器人C++開源庫The Robotics Library (RL)使用手冊（二）

由于RL庫采用跨平臺CMake源碼，可以輕松在win、ubantu等平臺部署、編譯，win通常用VS編譯器，為了便于使用、閱讀，需要將CMake編譯成VS工程。 1、準備三個工具：CMake、VS、QT 為了在Windows上編譯RL和依賴項，您需要安裝一個編譯器（例如。，Visual Studio 2017)和跨平臺構…

閱讀更多...

如何在LabVIEW中更好地使用ActiveX控件？

如何在LabVIEW中更好地使用ActiveX控件？

在LabVIEW中，ActiveX控件可以幫助實現與其他應用程序或第三方組件的集成（例如Microsoft Excel、Word、Internet Explorer等）。以下是一些建議，幫助您更好地在LabVIEW中使用ActiveX控件： ? 1. 理解ActiveX控件的基本原…

閱讀更多...

如何使用Python從SACS結構數據文件中提取節點數據信息并導出到EXCEL

如何使用Python從SACS結構數據文件中提取節點數據信息并導出到EXCEL

在現代工程設計中，結構分析和數據處理是不可或缺的一部分。特別是在海洋工程、橋梁建設等領域，SACS文件被廣泛應用。這種文件格式包含了結構模型的各種重要信息，包括節點（JOINT）、構件（ELEMENT）…

閱讀更多...

如何判斷一個學術論文是否具有真正的科研價值？ChatGPT如何提供幫助？

如何判斷一個學術論文是否具有真正的科研價值？ChatGPT如何提供幫助？

目錄 1.創新性與學術貢獻的超級加分? 2.科研過程中的各個環節—從0到1? 3.創新性與理論深度的完美結合? 4.論證與寫作的清晰性? 5.數據整理和文獻回顧——效率與精準并存? 6.創新性要求輔助? 總結寶子們，學術論文寫作的旅程是不是感覺像是走進了迷霧森…

閱讀更多...

學習threejs，THREE.CircleGeometry 二維平面圓形幾何體

學習threejs，THREE.CircleGeometry 二維平面圓形幾何體

👨??? 主頁： gis分享者 👨??? 感謝各位大佬點贊👍 收藏? 留言📝 加關注?! 👨??? 收錄于專欄：threejs gis工程師文章目錄一、🍀前言1.1 ??THREE.CircleGeometry 圓形…

閱讀更多...

【微服務】SpringBoot 自定義消息轉換器使用詳解

【微服務】SpringBoot 自定義消息轉換器使用詳解

目錄一、前言二、SpringBoot 內容協商介紹 2.1 什么是內容協商 2.2 內容協商機制深入理解 2.2.1 內容協商產生的場景 2.3 內容協商實現的常用方式 2.3.1 前置準備 2.3.2 通過HTTP請求頭 2.3.2.1 操作示例 2.3.3 通過請求參數三、SpringBoot 消息轉換器介紹 3.1 H…

閱讀更多...

最新文章