Hadoop生態圈框架部署 - Windows上部署Hadoop

文章目錄

  • 前言
  • 一、下載Hadoop安裝包及bin目錄
    • 1. 下載Hadoop安裝包
    • 2. 下載Hadoop的bin目錄
  • 二、安裝Hadoop
    • 1. 解壓Hadoop安裝包
    • 2. 解壓Hadoop的Windows工具包
  • 三、配置Hadoop
    • 1. 配置Hadoop環境變量
      • 1.1 打開系統屬性設置
      • 1.2 配置環境變量
      • 1.3 驗證環境變量是否配置成功
    • 2. 修改Hadoop配置文件
      • 2.2 修改 core-site.xml 配置文件
      • 2.3 修改 hdfs-site.xml 配置文件
      • 3.4 修改 mapred-site.xml 配置文件
      • 3.5 修改 yarn-site.xml 配置文件
    • 3. 格式化HDFS(Hadoop分布式文件系統)
    • 4. 復制timelineservice目錄
    • 5. Hadoop啟動和停止
      • 5.1 啟動 Hadoop
      • 5.2 停止 hadoop 集群


前言

Hadoop作為大數據領域的基石框架,在數據存儲與處理方面展現出了卓越的性能與強大的擴展性,為海量數據的高效管理與分析提供了有力支撐。在當今數字化浪潮席卷全球,數據量呈爆發式增長的時代背景下,掌握Hadoop的安裝與配置技能顯得尤為重要,它是開啟大數據世界大門的一把關鍵鑰匙。無論是企業希望從繁雜的數據中挖掘商業價值,還是科研人員致力于數據分析以推動學術研究進展,Hadoop都能發揮其獨特的優勢。本文將以清晰明了的步驟,詳細闡述在特定環境下Hadoop的安裝與配置過程,旨在幫助讀者順利搭建起Hadoop運行環境,為后續深入探索大數據技術奠定堅實基礎。


一、下載Hadoop安裝包及bin目錄

1. 下載Hadoop安裝包

華為云鏡像站下載:https://mirrors.huaweicloud.com/repository/apache/hadoop/common/hadoop-3.3.0/hadoop-3.3.0.tar.gz

2. 下載Hadoop的bin目錄

下載Hadoop的bin目錄地址:https://gitcode.com/gh_mirrors/wi/winutils/tree/master/hadoop-3.0.0/bin

進入下載網站后,點擊下載當前目錄,如下圖所示。

在這里插入圖片描述


二、安裝Hadoop

1. 解壓Hadoop安裝包

雙擊下載好的安裝包,點擊解壓,選則解壓路徑,然后點擊確定,如下圖所示。

在這里插入圖片描述

2. 解壓Hadoop的Windows工具包

解壓Hadoop的Windows工具包到下載目錄,如下圖所示。

在這里插入圖片描述

把Hadoop的Windows工具包中的bin目錄復制到解壓后的Hadoop目錄,覆蓋原有的bin目錄,如下圖所示。

在這里插入圖片描述


三、配置Hadoop

1. 配置Hadoop環境變量

1.1 打開系統屬性設置

  • 右鍵點擊“此電腦”,選擇“屬性”,點擊“高級系統設置”。
  • 在彈出的“系統屬性”窗口中,點擊“環境變量”。
    在這里插入圖片描述

1.2 配置環境變量

在環境變量頁面點擊新建,輸入變量名和變量值(變量名為HADOOP_HOME,變量值為解壓后的hadoop目錄),然后點擊確定,如下圖所示。

在這里插入圖片描述

路徑變量配置步驟如下圖所示。

在這里插入圖片描述

1.3 驗證環境變量是否配置成功

打開一個新的命令提示符窗口(cmd),輸入 hadoop version 來驗證hadoop環境變量是否正確配置。如果顯示了版本信息,則說明環境變量配置成功。

配置成功如下圖所示:

在這里插入圖片描述

注意:
如出現如下圖所示的異常,說明jdk路徑在C盤,需要使用C:\PROGRA~1"C:\Program Files"代替C:\Program Files

在這里插入圖片描述

解決方法:
D:\development\hadoop-3.3.0\etc\hadoop\hadoop-env.cmd文件中set JAVA_HOME=%JAVA_HOME%修改為set JAVA_HOME=C:\PROGRA~1\Java\jdk-1.8

2. 修改Hadoop配置文件

2.2 修改 core-site.xml 配置文件

修改hadoop核心配置文件D:\development\hadoop-3.3.0\etc\hadoop\core-site.xml,內容如下所示。

<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?><configuration><!-- 指定Hadoop集群的默認文件系統名稱 --><property><name>fs.defaultFS</name><value>hdfs://127.0.0.1:9000</value></property>
</configuration>

2.3 修改 hdfs-site.xml 配置文件

修改hdfs的配置文件D:\development\hadoop-3.3.0\etc\hadoop\hdfs-site.xml,內容如下所示。

<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?><configuration><property><name>dfs.replication</name><value>1</value></property><property><name>dfs.namenode.secondary.http-address</name><value>127.0.0.1:9868</value></property><property>    <name>dfs.namenode.name.dir</name>    <value>/D:/development/hadoop-3.3.0/data/namenode</value>    </property>    <property>    <name>dfs.datanode.data.dir</name>    <value>/D:/development/hadoop-3.3.0/data/datanode</value>  </property>
</configuration>

3.4 修改 mapred-site.xml 配置文件

修改mapreduce的配置文件D:\development\hadoop-3.3.0\etc\hadoop\mapred-site.xml,內容如下所示。

<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?><configuration><property><name>mapreduce.framework.name</name><value>yarn</value></property>
</configuration>

3.5 修改 yarn-site.xml 配置文件

修改yarn的配置文件D:\development\hadoop-3.3.0\etc\hadoop\yarn-site.xml,內容如下所示。

<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?><configuration><property><name>yarn.nodemanager.aux-services</name><value>mapreduce_shuffle</value></property><property><name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name><value>org.apache.hadoop.mapred.ShuffleHandler</value></property><property><name>yarn.nodemanager.resource.memory-mb</name><value>1024</value></property><property><name>yarn.nodemanager.resource.cpu-vcores</name><value>1</value></property></configuration>

3. 格式化HDFS(Hadoop分布式文件系統)

執行如下命令格式化Hadoop分布式文件系統HDFS。

hdfs namenode -format

格式化成功如下圖所示,會提示我們存儲目錄 D:\development\hadoop-3.3.0\data\namenode 已經成功格式化

在這里插入圖片描述

4. 復制timelineservice目錄

D:\development\hadoop-3.3.0\share\hadoop\yarn\timelineservice目錄下的jar包復制到上級目錄,如下圖所示。

在這里插入圖片描述

5. Hadoop啟動和停止

5.1 啟動 Hadoop

在cmd中執行如下命令啟動Hadoop。

start-all.cmd

在這里插入圖片描述

訪問 HDFS(NameNode)的 Web UI 頁面
在啟動hadoop集群后,在瀏覽器輸入http://127.0.0.1:9870進行訪問,如下圖。
在這里插入圖片描述

檢查DataNode是否正常,正常如下圖所示。
在這里插入圖片描述

訪問 YARN 的 Web UI 頁面
在啟動hadoop集群后,在瀏覽器輸入http://127.0.0.1:8088進行訪問,如下圖。
在這里插入圖片描述

5.2 停止 hadoop 集群

在cmd中執行如下命令啟動Hadoop。

stop-all.cmd

在這里插入圖片描述

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/78131.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/78131.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/78131.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

搜廣推校招面經八十一

OPPO搜廣推一面面經 一、介紹一下PLE模型 在多任務學習&#xff08;Multi-Task Learning, MTL&#xff09;中&#xff0c;多個任務共享部分模型結構&#xff0c;以提升整體效果。然而&#xff0c;不同任務間存在 任務沖突&#xff08;Task Conflict&#xff09; 問題&#xf…

LangChain 中主流的 RAG 實現方式

文章目錄 **一、基礎流程實現**1. **全自動索引構建&#xff08;VectorstoreIndexCreator&#xff09;**2. **標準問答鏈&#xff08;RetrievalQA&#xff09;**3. **Document Chain 手動檢索**4. **load_qa_chain&#xff08;傳統方式&#xff09;** **二、高級定制化實現**1…

解決:springmvc工程 響應時,將實體類對象 轉換成json格式數據

問題&#xff1a;一直無法將user對象轉成json格式 按理來說&#xff0c;我在類上使用RestController注解&#xff0c;就可以實現將實體類對象寫入響應體中&#xff0c;并作為json格式傳遞到客戶端&#xff0c;但現實是沒有生效&#xff0c;并且出現404&#xff0c;406&#xf…

【踩坑記錄】stm32 jlink程序燒錄不進去

最近通過Jlink給STM32燒寫程序時一直報錯&#xff0c;但是換一個其他工程就可以燒錄&#xff0c;對比了一下jink配置&#xff0c;發現是速率選太高了“SW Device”&#xff0c;將燒錄速率調整到10MHz以下就可以了

運維打鐵:Mysql 分區監控以及管理

文章目錄 一、簡介二、設計邏輯1、配置文件檢查2、創建邏輯3、 刪除邏輯4、重建表分區邏輯5、recognize maxvalue分區表邏輯6、創建多個未來分區邏輯7、定時檢測分區是否創建成功&#xff0c;否則發送告警郵件。 三、解決的問題四、配置例子與介紹 一、簡介 操作數據庫&#xf…

Appium自動化開發環境搭建

自動化 文章目錄 自動化前言 前言 Appium是一款開源工具&#xff0c;用于自動化iOS、Android和Windows桌面平臺上的本地、移動web和混合應用程序。原生應用是指那些使用iOS、Android或Windows sdk編寫的應用。移動網頁應用是通過移動瀏覽器訪問的網頁應用(appum支持iOS和Chrom…

《R語言SCI期刊論文繪圖專題計劃》大綱

今天開始&#xff0c;我將和大家分享系統且詳細的《R語言SCI期刊繪圖專題教程》&#xff0c;內容會從基礎到高階應用&#xff0c;從配色美學到頂刊風格復現&#xff0c;確保大家可以學到高質量內容&#xff01;下面是大綱。 &#x1f4da;《R語言SCI期刊論文繪圖專題計劃》 第…

STUN協議 與 TURN協議

STUN&#xff08;Session Traversal Utilities for NAT&#xff0c;NAT會話穿越應用程序&#xff09;是一種網絡協議&#xff0c; STUN&#xff08;Simple Traversal of User Datagram Protocol through Network Address Translators (NATs)&#xff0c;NAT的UDP簡單穿越&#…

在vscode終端中運行npm命令報錯

解決方案 這個錯誤信息表明&#xff0c;你的系統&#xff08;可能是 Windows&#xff09;阻止了 PowerShell 執行腳本&#xff0c;這是由于 PowerShell 的執行策略導致的。PowerShell 的執行策略控制著在系統上運行哪些 PowerShell 腳本。默認情況下&#xff0c;Windows 可能…

手搓雷達圖(MATLAB)

看下別人做出來什么效果 話不多說&#xff0c;咱們直接開始 %% 可修改 labels {用戶等級, 發帖數, 發帖頻率, 點度中心度, 中介中心度, 帖子類型計分, 被列為提案數}; cluster_centers [0.8, 4.5, 3.2, 4.0, 3.8, 4.5, 4.2; % 核心用戶0.2, 0.5, 0.3, 0.2, 0.1, 0.0, 0.0;…

ViViT: 一種視頻視覺Transformer

摘要 我們提出了基于純transformer的視頻分類模型,借鑒了這種模型在圖像分類中的成功經驗。我們的模型從輸入視頻中提取時空token,然后通過一系列transformer層進行編碼。為了處理視頻中遇到的長序列token,我們提出了幾種高效的模型變種,這些變種將輸入的空間和時間維度進…

嵌入式鴻蒙系統環境搭建與配置要求實現01

各位開發者大家好,今天主要給大家分享一下,鴻蒙系統的環境配置實現。 第一:鴻蒙配置基本要求 對電腦的要求,虛擬機配置建議 200GB 硬盤大小,10GB 內存,4*2CPU。 安裝必要的依賴文件方法: sudo apt-get update && sudo apt-get install binutils git git-lfs g…

【多目標進化算法】常見多目標進化算法一覽

算法全稱核心特點備注NSGA-IINon-dominated Sorting Genetic Algorithm II非支配排序 擁擠度最經典&#xff0c;應用最廣NSGA-IIINon-dominated Sorting Genetic Algorithm III支撐向量引導&#xff0c;適合高維&#xff08;3目標以上&#xff09;NSGA-II 的高維擴展版MOEA/DM…

創意無限,從這些視頻素材開始你的創作!

在視頻創作的世界里&#xff0c;找到合適的素材就像是挖掘寶藏&#xff0c;不僅能節省時間&#xff0c;還能讓作品瞬間提升一個檔次。今天&#xff0c;就來給大家分享一些超實用的視頻素材網站&#xff0c;無論是國內的寶藏平臺&#xff0c;還是國外的優質資源&#xff0c;都能…

QT創建新項目(13)

文章目錄 一、本章說明二、QT組件簡介及相關筆記三、項目創建四、QT學習建議一、本章說明 注:本節為【基于STM的環境監測系統(節點+云服務器存儲+QT界面設計)】項目第13篇文章,前面已安裝了QT軟件,本章主要介紹新項目創建及注意事項,QT的初學者相關學習資料 二、QT組件…

Langgraph實戰-Agent-ReAct(Reason+Act)概述

Langgraph實戰-Agent-ReAct&#xff08;ReasonAct&#xff09;概述 概述 ReAct 架構將推理與動作相結合&#xff0c;使Agent能夠通過生成想法并基于這些想法執行動作。這種決策透明度使Agent能夠更負責地執行任務&#xff0c;因為它會記錄每一步的推理過程。 這種架構最適合…

論文筆記(七十九)STOMP: Stochastic Trajectory Optimization for Motion Planning

STOMP: Stochastic Trajectory Optimization for Motion Planning 文章概括摘要一、引言二、相關工作三、STOMP 算法A. 探索B. 軌跡更新 四、機械臂的運動規劃A. 設置B. 代價函數1&#xff09;障礙物代價&#xff1a;2&#xff09;約束代價&#xff1a;3&#xff09;扭矩代價&a…

MCU開發學習記錄9 - 通用定時器學習與實踐(HAL庫) -RGBLED控制、定時器輸入捕獲、主從定時器移相控制-STM32CubeMX

本文將介紹通用定時器的概念、相關函數以及STM32CubeMX生成定時器的配置函數以及對生成定時器的配置函數進行分析&#xff08;包括結構體配置、相關寄存器配置&#xff09;。 本文以TIM2/TIM5、TIM3/TIM4為基礎介紹通用定時器&#xff08;包含通用定時器全部功能&#…

Java學習手冊:TCP 協議基礎

一、TCP 協議概述 TCP&#xff08;Transmission Control Protocol&#xff0c;傳輸控制協議&#xff09;是一種面向連接的、可靠的、基于字節流的傳輸層通信協議&#xff0c;它在 IP 協議的基礎上提供了可靠的 數據傳輸服務。TCP 通過三次握手建立連接&#xff0c;通過四次揮手…

刪除排序數組中的重復項--LeetCode

題目 給你一個非嚴格遞增排列的數組 nums &#xff0c;請你原地刪除重復出現的元素&#xff0c;使每個元素 只出現一次 &#xff0c;返回刪除后數組的新長度。元素的 相對順序 應該保持 一致 。然后返回 nums 中唯一元素的個數。 考慮 nums 的唯一元素的數量為 k &#xff0c…