hadoop 是一個免費開源軟件, 可以安裝在window上,但是有些麻煩。
也可以安裝 在linux 上
hadoop 下載地址 :https://hadoop.apache.org/releases.html
安裝前的準備工作:
1.安裝jdk
Apache Hadoop 與最新版本的JDK不兼容。建議下載Java SE Development Kit版本15.0.x
(僅在未安裝Java或從未設置Java路徑時才執行此步驟)。
2.設置環境變量
進入設置 -> 搜索 “環境變量” -> 選擇 "編輯系統變量 "選項。出現以下對話框:
選擇新按鈕并在變量名稱中鍵入“JAVA_HOME”,將值設置為Java SDK的bin文件夾的路徑(通常為類型:C:\Program Files\Java\jdk-15.0.1\bin)。對于用戶和系統變量都執行此步驟。
正式安裝:
1.上傳和解壓Hadoop:使用文件傳輸工具將Hadoop安裝包上傳到目標服務器的適當目錄,例如/opt目錄下的software文件夾。
進入Hadoop安裝包所在路徑,然后解壓安裝文件到指定目錄,如/opt/module。
- 配置環境變量:
編輯系統的環境變量文件(如bashrc或profile),添加Hadoop的bin目錄到PATH環境變量中,以便系統能夠識別Hadoop命令。3.驗證安裝:通過運行Hadoop的版本命令(如hadoop version)來檢查Hadoop是否已正確安裝并配置。
- 集群配置(可選):
如果您打算在集群環境中運行Hadoop,還需要進行額外的配置工作,包括網絡配置、SSH免密登錄設置、Hadoop配置文件的修改等。
- 測試Hadoop:
運行一個簡單的MapReduce程序或者啟動Hadoop的各個組件來測試其功能是否正常。高級配置(可選):根據需要設置Hadoop的安全機制、性能調優、存儲和計算資源的管理等。偽分布式和完全分布式安裝:對于學習和開發目的,您可以選擇安裝Hadoop的本地模式或偽分布式模式。如果需要搭建一個真正的分布式環境,那么您需要按照完全分布式安裝的步驟來進行配置。
請注意,這些步驟可能會根據您所使用的Hadoop版本和操作系統有所不同。建議參考官方文檔和相關教程來獲取更詳細的指導。此外,如果您是第一次安裝Hadoop,可能需要一些Linux系統的基礎知識和對Hadoop概念的基本了解。