Hadoop 單機模式（Standalone Mode）部署與 WordCount 測試

通過本次實驗，成功搭建了 Hadoop 單機環境并運行了基礎 MapReduce 程序，為后續分布式計算學習奠定了基礎。

掌握 Hadoop 單機模式的安裝與配置方法。
熟悉 Hadoop 環境變量的配置及 Java 依賴管理。
使用 Hadoop 自帶的 WordCount 示例程序進行簡單的 MapReduce 計算，驗證安裝是否成功。

環境準備

?操作系統：推薦 Linux（如 Ubuntu/CentOS）或 macOS（Windows 需通過 WSL 或虛擬機）

?Java 環境：

安裝 JDK 1.8+（Hadoop 3.x 需 Java 8 或 11）

?如果安裝過，需要卸載以前的包，并且刪掉環境變量，然后干掉目錄

如果未安裝過可以直接進行下一步操作

# 查詢已安裝的 JDK 包
rpm -qa | grep 'java\|jdk\|gcj\|jre'# 卸載指定包（替換為實際查詢結果）
yum -y remove java*# 修改環境變量，刪掉環境那兩行
vi /etc/profile#使其生效
source /etc/profile# 清空opt目錄下面的東西
cd /opt/
rm -rf *

安裝jdk

1.上傳jdk壓縮包jdk-8u181-linux-x64.tar.gz

沒有的可以前往飛書直接下載我的

Docs

2.解壓縮后目錄如下，刪除壓縮包節省空間，并改名方便操作

tar -zxvf jdk-8u181-linux-x64.tar.gz -C /opt/rm -rf jdk-8u181-linux-x64.tar.gzmv "jdk1.8.0_181" "jdk1.8"

3.配置環境變量

sudo vi /etc/profileexport JAVA_HOME=/opt/jdk1.8  #填寫自己的jdk路徑
export PATH=$JAVA_HOME/bin:$PATH

4.環境生效

source /etc/profile

5.查看版本確認安裝

java -version

安裝hadoop

1.沒有wegt命令的自行下載

yum -y install wget

2.回到opt目錄（和jdk一個目錄），下載hadoop

cd /opt
wget https://mirrors.aliyun.com/apache/hadoop/common/hadoop-3.3.6/hadoop-3.3.6.tar.gz

3.檢查下載再解壓，解壓后可以刪掉壓縮包節省空間，進行改名

# 檢查是否wget成功
ls
# 解壓縮
tar -zxvf hadoop-3.3.6.tar.gz -C /opt/# 刪除壓縮包節省空間
rm -rf hadoop-3.3.6.tar.gz#修改名字
mv /opt/hadoop-3.3.6 /opt/hadoop

4.配置環境變量，使其生效

# 配置環境變量（編輯 ~/.bashrc 或 ~/.zshrc)
vim ~/.bashrcexport HADOOP_HOME=/opt/hadoop
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin# 使配置生效
source ~/.bashrc

5.檢查hadoop版本，驗證是否安裝成功

hadoop version

進行測試

計算test.txt（計算就是統計文本單詞重復出現多少次）

1.創建測試腳本

# 創建輸入目錄（注意是創建在在root目錄下）
mkdir -p ~/hadoop-input
# 寫入測試文本
echo "Hello World Hello Hadoop" > ~/hadoop-input/test.txt
# 檢查是否寫入
cd ~
ls
cd hadoop-input
ls
cat test.txt

2.查看hadoop提供的案例（只是告訴你hadoop案例放在哪里而已，可以不操作）

cd /opt/hadoop
#查看目錄，里面有個share，存放這hadoop的默認案例
cd share/hadoop/mapreduce
ls

3. 執行 WordCount，出現successfully字樣，此時統計完成

hadoop jar $HADOOP_HOME/share/hadoop/mapreduce/hadoop-mapreduce-examples-3.3.6.jar \wordcount ~/hadoop-input ~/hadoop-output

4.查看統計結果

cd ~
cd hadoop-output
ls
cat part-r-00000

單機部署完成

實驗總結

成功點：
- 完成 JDK 和 Hadoop 的安裝與配置。
- 驗證了 Hadoop 單機模式的基本功能（MapReduce 計算）。
注意事項：
- 需確保環境變量配置正確（如?JAVA_HOME、HADOOP_HOME）。
- 輸入/輸出目錄需提前創建，避免權限問題。
后續擴展：
- 嘗試偽分布式模式（Pseudo-Distributed Mode）部署。
- 使用其他 Hadoop 示例（如?grep、pi）進行測試。

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/web/78123.shtml
繁體地址，請注明出處：http://hk.pswp.cn/web/78123.shtml
英文地址，請注明出處：http://en.pswp.cn/web/78123.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！