Apache Hadoop完全分布式集群搭建指南

Hadoop發行版本較多,Cloudera版本(Cloudera’s Distribution Including Apache Hadoop,簡稱CDH)收費版本通常用于生產環境,這里用開源免費的Apache Hadoop原始版本。

下載:Apache Hadoop

版本下載:Index of /hadoop/common

Hadoop基礎知識可查看本專欄其它篇章:Apache Hadoop的核心組成及其架構_hadoop的核心架構是怎樣-CSDN博客

環境準備

準備三臺虛擬機,并安裝JDK1.8,時間需要同步。

集群規劃

應用hadoop01hadoop02hadoop03
HDFSNameNode、DataNodeDataNodeSecondaryNameNode、DataNode
YARNNodeManagerNodeManagerNodeManager、ResourceManager
ntpdntpdntpdntpd

主機名與域名設置

hostnamectl  --static set-hostname hadoop01

修改/etc/hosts

192.168.43.101 hadoop01
192.168.43.102 hadoop02
192.168.43.103 hadoop03

ssh免密登錄

在三臺主機執行下面兩句命令,一直回車即可,不需要輸入密碼,確保三臺主機都可免密登錄,后續使用hadoop集群批量啟動腳本時會特別方便。

ssh-keygen
ssh-copy-id root@192.168.43.101
ssh-copy-id root@192.168.43.102
ssh-copy-id root@192.168.43.103

Hadoop集群安裝

hadoop安裝

解壓安裝包

tar -zxvf hadoop-2.9.2.tar.gz -C /opt/

將hadoop添加到環境變量,/etc/profile

export HADOOP_HOME=/opt/hadoop-2.9.2
export PATH=$PATH:$HADOOP_HOME/bin
export PATH=$PATH:$HADOOP_HOME/sbin

使環境變量生效

source /etc/profile

驗證版本

hadoop version

Hadoop目錄介紹

drwxr-xr-x 2 root root    194 Nov 13  2018 bin
drwxr-xr-x 3 root root     20 Nov 13  2018 etc
drwxr-xr-x 2 root root    106 Nov 13  2018 include
drwxr-xr-x 3 root root     20 Nov 13  2018 lib
drwxr-xr-x 2 root root    239 Nov 13  2018 libexec
-rw-r--r-- 1 root root 106210 Nov 13  2018 LICENSE.txt
-rw-r--r-- 1 root root  15917 Nov 13  2018 NOTICE.txt
-rw-r--r-- 1 root root   1366 Nov 13  2018 README.txt
drwxr-xr-x 3 root root   4096 Nov 13  2018 sbin
drwxr-xr-x 4 root root     31 Nov 13  2018 share
?
1.bin目錄:對Hadoop進行操作的相關命令,如hadoop,hdfs等
2.etc目錄:Hadoop的配置文件目錄,入hdfs-site.xml,core-site.xml等
3.lib目錄:Hadoop本地庫(解壓縮的依賴)
4.sbin目錄:存放的是Hadoop集群啟動停止相關腳本,命令
5.share目錄:Hadoop的一些jar,官方案例jar,文檔等

集群配置

Hadoop集群配置 = HDFS集群配置 + MapReduce集群配置 + Yarn集群配置

HDFS集群配置
  • 配置jdk路徑,etc/hadoop/hadoop-env.sh

    export JAVA_HOME=/usr/local/jdk1.8.0_231

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/40963.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/40963.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/40963.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

《米小圈日記魔法》邊看邊學,輕松掌握寫日記的魔法!

在當今充滿數字化娛樂和信息快速變遷的時代,如何創新引導孩子們學習,特別是如何培養他們的寫作能力,一直是家長和教育者們關注的焦點。今天就向大家推薦一部寓教于樂的動畫片《米小圈日記魔法》,該系列動畫通過其獨特的故事情節和…

Linux安裝ftp、Java的FTP上傳下載文件工具類

Linux安裝ftp、Java的FTP上傳下載文件工具類 文章說明Linux安裝vsftpdJava的工具類 文章說明 網上找到說linux安裝ftp,采用vsftpd,在后續的配置中少了一些說明,給我折磨了許久,寫下這篇文章來記錄 Linux安裝vsftpd 命令非常簡單&a…

vue通過后臺返回的數字顯示不同的文字內容,多個內容用、隔開

后臺返回的數據 顯示效果&#xff1a; html&#xff1a; <el-table-columnalign"center"label"使用過的小程序"width"124"v-if"activeTab 0"><template #default"scope"><divv-for"(item, index) in s…

數據結構(3.5)——隊列的順序實現

隊列的順序實現 #define MaxSize 10//定義隊列中元素的最大個數 typedef struct {int data[MaxSize];//用靜態數組存放隊列元素int front, rear;//隊頭指針和隊尾指針 } SqQueue;void testQueue() {SqQueue Q;//聲明一個隊列(順序存儲) } 隊列的初始化操作和判空 //初始化隊…

大模型面試題目

1.為什么需要做位置編碼 位置編碼&#xff08;Positional Encoding&#xff09;在變換器&#xff08;Transformer&#xff09;模型中非常重要&#xff0c;因為變換器架構本身沒有內置的順序信息。變換器使用的是自注意力機制&#xff0c;它能夠捕捉輸入序列中所有詞之間的相關性…

論文解析——Transformer 模型壓縮算法研究及硬件加速器實現

作者及發刊詳情 鄧晗珂&#xff0c;華南理工大學 摘要 正文 實驗平臺 選取模型&#xff1a; T r a n s f o r m e r b a s e Transformer_{base} Transformerbase? 訓練數據集&#xff1a;WMT-2014 英語-德語翻譯數據集、IWSLT-2014 英語-德語互譯數據集 Transformer模…

JVM垃圾回收性能調優實戰指南

JVM垃圾回收性能調優實戰指南 一、引言 在Java應用程序中&#xff0c;垃圾回收&#xff08;Garbage Collection, GC&#xff09;是自動管理內存的重要機制。然而&#xff0c;不恰當的垃圾回收配置可能導致性能瓶頸&#xff0c;如頻繁的GC暫停、內存碎片過多等。因此&#xff…

kpatch制作內核熱補丁步驟總結

零、原理及參考 kpatch入門實踐教程-CSDN博客 Kpatch 使用過程及其原理-CSDN博客 一、準備工作 安裝對應版本的kpatch-build.rpm并解決依賴diff -Naur dir1 dir2 > hot.patch 拿到補丁文件下載對應內核版本的src.rpm安裝好對應的開發包kernel-debuginfo&#xff0c;kern…

從GPT-1到GPT-3 預訓練語言模型的演進與突破

本文由 ChatMoney團隊出品 前言 Generative Pre-trained Transformer&#xff08;GPT&#xff09;系列是由OpenAI開發的預訓練語言模型&#xff0c;它們在多種NLP任務中取得了令人矚目的成績&#xff0c;包括文章生成、代碼生成、機器翻譯和問答等。GPT系列模型的核心思想是通…

數據庫開發:mysql基礎一

文章目錄 數據庫開發Day15&#xff1a;MySQL基礎&#xff08;一&#xff09;一、MySQL介紹與安裝【1】MySQL介紹&#xff08;5&#xff09;啟動MySQL服務&#xff08;6&#xff09;修改root登陸密碼 二、SQL簡介三、數據庫操作四、數據表操作4.1、數據庫數據類型4.2、創建數據表…

對標 GPT-4o 的開源實時語音多模態模型:Moshi

是由法國的 AI 實驗室 Kyutai 推出的實時語音多模態模型&#xff0c;支持聽、說、看&#xff0c;最關鍵的是你現在就可以在瀏覽器中使用&#xff0c;如果這個鏈接延遲高&#xff0c;可以試試這個, 無需輸入郵箱&#xff0c;點擊 Join queue 即可。 簡單體驗了下&#xff0c;比…

#### golang中【堆】的使用及底層 ####

聲明&#xff0c;本文部分內容摘自&#xff1a; Go: 深入理解堆實現及應用-騰訊云開發者社區-騰訊云 數組實現堆 | WXue 堆&#xff08;Heap&#xff09;是實現優先隊列的數據結構&#xff0c;Go提供了接口和方法來操作堆。 應用 package mainimport ("container/heap&q…

結構方程模型-驗證性因子分析模型

初級 第7講 驗證性因子分析模_嗶哩嗶哩_bilibili

使用 ESP32 接收來自 MAX4466 模擬麥克風模塊的數據,并通過 DAC 輸出模擬音頻信號,可以通過以下步驟實現:

硬件準備 ESP32 開發板MAX4466 模擬麥克風模塊揚聲器或耳機接線 MAX4466 模塊輸出(AO) -> ESP32 ADC 引腳(如 GPIO 34)ESP32 DAC 引腳(如 GPIO 25 或 GPIO 26) -> 揚聲器或耳機軟件準備 音頻采集DAC 轉碼并播放代碼實現 以下代碼展示了如何從 MAX4466 讀取模擬音頻…

【Go語言入門學習筆記】Part7.閉包和defer關鍵字

一、前言 閉包有點像對象&#xff0c;而defer適合于類似功能中利用資源時&#xff0c;提前寫幾句defer 釋放資源&#xff0c;防止后面釋放資源忘記寫釋放資源。 二、學習代碼 package mainimport ("fmt" )// getC的返回值是一個函數&#xff0c;需要的參數為空&…

GitHub Pull Request流程詳解

GitHub Pull Request流程詳解 在協作開發中&#xff0c;GitHub的Pull Request&#xff08;PR&#xff09;功能至關重要&#xff0c;它允許開發者在代碼庫中進行修改、審查和合并代碼。本文將詳細介紹GitHub Pull Request的完整流程&#xff0c;幫助你更好地理解和使用這一強大…

網絡安全的十字路口:向“架構化”轉移

市場條件正在快速變化 針對上述這些問題&#xff0c;在這段時間里&#xff0c;安全技術供應商推出了許多技術解決方案&#xff0c;比如SIEM、SOAR、XDR、UEBA等&#xff0c;但新產品的推出并未使得安全態勢有所好轉&#xff0c;許多問題依然存在&#xff0c;這導致了市場動態的…

【DevOps】Java內存分配與JVM參數詳解

目錄 引言 JVM內存結構 JVM參數概述 堆內存分配 年輕代與老年代 調整堆內存大小 調整年輕代與老年代比例 元空間分配 調整元空間大小 垃圾回收 調整GC參數 調整GC日志 線程棧分配 調整線程棧大小 性能調優 結論 在Java開發中&#xff0c;理解Java虛擬機&#x…

claude3.5寫作——《基于灰色預測的中國人口數量預測》

文章目錄 站點和提問引言一、灰色預測模型介紹二、中國歷年人口數據三、灰色預測模型的建立1.建立原始序列2.生成1-AGO序列3.計算背景值4.構造數據矩陣并計算參數5.模型檢驗6.模型預測 四、預測結果分析五、政策建議結語參考文獻 站點和提問 站點&#xff1a;中國官方克勞德3.…

如何更改 Python pip 源為國內源

在使用 Python 安裝包工具 pip 時&#xff0c;經常會遇到下載速度慢的問題。這通常是因為默認使用的官方源 https://pypi.org/simple 在國內訪問速度較慢。為了提高下載速度&#xff0c;我們可以將 pip 源更改為國內的鏡像源。本文將介紹如何臨時和永久地更改 pip 源為國內源。…