通過本次實驗,成功搭建了 Hadoop 單機環境并運行了基礎 MapReduce 程序,為后續分布式計算學習奠定了基礎。
-
掌握 Hadoop 單機模式的安裝與配置方法。
-
熟悉 Hadoop 環境變量的配置及 Java 依賴管理。
-
使用 Hadoop 自帶的 WordCount 示例程序進行簡單的 MapReduce 計算,驗證安裝是否成功。
環境準備
?操作系統:推薦 Linux(如 Ubuntu/CentOS)或 macOS(Windows 需通過 WSL 或虛擬機)
?Java 環境:
安裝 JDK 1.8+(Hadoop 3.x 需 Java 8 或 11)
?如果安裝過,需要卸載以前的包,并且刪掉環境變量,然后干掉目錄
如果未安裝過可以直接進行下一步操作
# 查詢已安裝的 JDK 包
rpm -qa | grep 'java\|jdk\|gcj\|jre'# 卸載指定包(替換為實際查詢結果)
yum -y remove java*# 修改環境變量,刪掉環境那兩行
vi /etc/profile#使其生效
source /etc/profile# 清空opt目錄下面的東西
cd /opt/
rm -rf *
安裝jdk
1.上傳jdk壓縮包jdk-8u181-linux-x64.tar.gz
沒有的可以前往飛書直接下載我的
Docs
2.解壓縮后目錄如下,刪除壓縮包節省空間,并改名方便操作
tar -zxvf jdk-8u181-linux-x64.tar.gz -C /opt/rm -rf jdk-8u181-linux-x64.tar.gzmv "jdk1.8.0_181" "jdk1.8"
?
3.配置環境變量
sudo vi /etc/profileexport JAVA_HOME=/opt/jdk1.8 #填寫自己的jdk路徑
export PATH=$JAVA_HOME/bin:$PATH
4.環境生效
source /etc/profile
5.查看版本確認安裝
java -version
安裝hadoop
1.沒有wegt命令的自行下載
yum -y install wget
2.回到opt目錄(和jdk一個目錄),下載hadoop
cd /opt
wget https://mirrors.aliyun.com/apache/hadoop/common/hadoop-3.3.6/hadoop-3.3.6.tar.gz
3.檢查下載再解壓,解壓后可以刪掉壓縮包節省空間,進行改名
# 檢查是否wget成功
ls
# 解壓縮
tar -zxvf hadoop-3.3.6.tar.gz -C /opt/# 刪除壓縮包節省空間
rm -rf hadoop-3.3.6.tar.gz#修改名字
mv /opt/hadoop-3.3.6 /opt/hadoop
4.配置環境變量,使其生效
# 配置環境變量(編輯 ~/.bashrc 或 ~/.zshrc)
vim ~/.bashrcexport HADOOP_HOME=/opt/hadoop
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin# 使配置生效
source ~/.bashrc
5.檢查hadoop版本,驗證是否安裝成功
hadoop version
進行測試
計算test.txt(計算就是統計文本單詞重復出現多少次)
1.創建測試腳本
# 創建輸入目錄(注意是創建在在root目錄下)
mkdir -p ~/hadoop-input
# 寫入測試文本
echo "Hello World Hello Hadoop" > ~/hadoop-input/test.txt
# 檢查是否寫入
cd ~
ls
cd hadoop-input
ls
cat test.txt
2.查看hadoop提供的案例(只是告訴你hadoop案例放在哪里而已,可以不操作)
cd /opt/hadoop
#查看目錄,里面有個share,存放這hadoop的默認案例
cd share/hadoop/mapreduce
ls
3. 執行 WordCount,出現successfully字樣,此時統計完成
hadoop jar $HADOOP_HOME/share/hadoop/mapreduce/hadoop-mapreduce-examples-3.3.6.jar \wordcount ~/hadoop-input ~/hadoop-output
4.查看統計結果
cd ~
cd hadoop-output
ls
cat part-r-00000
單機部署完成
實驗總結
-
成功點:
-
完成 JDK 和 Hadoop 的安裝與配置。
-
驗證了 Hadoop 單機模式的基本功能(MapReduce 計算)。
-
-
注意事項:
-
需確保環境變量配置正確(如?
JAVA_HOME
、HADOOP_HOME
)。 -
輸入/輸出目錄需提前創建,避免權限問題。
-
-
后續擴展:
-
嘗試偽分布式模式(Pseudo-Distributed Mode)部署。
-
使用其他 Hadoop 示例(如?
grep
、pi
)進行測試。
-