配置Hadoop集群環境準備

  • Hadoop的運行模式

一共有三種:

  1. 本地運行。
  2. 偽分布式
  3. 完全分布式
  • Hadoop的完全分布式運行
  1. 要模擬這個功能,我們需要做好如下的準備。

    1)準備3臺客戶機(關閉防火墻、靜態IP、主機名稱)

    2)安裝JDK配置環境變量

    3)安裝Hadoop配置環境變量

    4)配置集群

    5)單點啟動

    6配置ssh

    7群起并測試集群

    其中,第1項我們在之前克隆虛擬機的環節中已經完成了。現在我們來看看按照JDK和Hadoop并配置環境變量的工作。有兩種思路:

    1. 每臺機器都去手動安裝一次(上傳jar包再去解壓)。

    2. 把一臺機器裝好,把module 拷貝到其他的機器。這樣就不需要省略了上傳和解壓的工作了。

    scp拷貝軟件到服務器

    scp可以實現服務器與服務器之間的數據拷貝。

    基本語法

    scp????-r ???????$pdir/$fname ????????????$user@$host:$pdir/$fname

    命令 ??遞歸 ????要拷貝的文件路徑/名稱 ??目的地用戶@主機:目的地路徑/名稱

    來,我們一起看下案例實操。假設你在三臺虛擬機(hadoop102、hadoop103、hadoop104)都已經創建好的/opt/module,/opt/software兩個目錄,在hadoop102這臺機器中已經安裝了jdk和hadoop。現在需要把102上的jdk拷貝到103中。

    具體操作是:

    1. 啟動虛擬機

    2. 進入到hadoop102。

    3. 命令:scp -r /opt/module/jdk1.8.0_212??root@hadoop103:/opt/module

    注意:這的hadoop103是虛擬機的名稱,如果沒有設置hosts則需要改成IP地址。

    拓展:scp根據所在的位置不同命令也支持不同的操作,例如:

    在A機器上,拉取B機器上的內容。

    在A機器上,把文件傳到B機器上

    在A機器上,把B機器上的文件傳遞到C機器上

    (b)在hadoop103上,將hadoop102中/opt/module/hadoop-3.1.3目錄拷貝到hadoop103上。

    scp -r root@hadoop102:/opt/module/hadoop-3.1.3 /opt/module/

    (c)在hadoop103上操作,將hadoop102中/opt/module目錄下所有目錄拷貝到hadoop104上。

    scp -r root@hadoop102:/opt/module/*?root@hadoop104:/opt/module

    (四)rsync遠程同步-配置文件

    rsync主要用于備份和鏡像。具有速度快、避免復制相同內容和支持符號鏈接的優點。

    rsync和scp區別:用rsync做文件的復制要比scp的速度快,rsync只對差異文件做更新。scp是把所有文件都復制過去。

    (1)基本語法

    rsync ???-av ??????$pdir/$fname ????????????$user@$host:$pdir/$fname

    命令 ??選項參數 ??要拷貝的文件路徑/名稱 ??目的地用戶@主機:目的地路徑/名稱

    ??選項參數說明

    選項

    功能

    -a

    歸檔拷貝

    -v

    顯示復制過程

    (2)案例實操

    (a)刪除hadoop103中/opt/module/hadoop-3.1.3/wcinput

    [root@hadoop103 hadoop-3.1.3]$ rm -rf wcinput/

    (b)同步hadoop102中的/opt/module/hadoop-3.1.3到hadoop103

    [root@hadoop102 module]$ rsync -av hadoop-3.1.3/ root@hadoop103:/opt/module/hadoop-3.1.3/

    xsync集群分發腳本

    (1)需求:循環復制文件到所有節點的相同目錄下

    (2)需求分析:

    (a)rsync命令原始拷貝:

    rsync ?-av ????/opt/module ? ?root@hadoop103:/opt/

    (b)期望腳本:

    xsync要同步的文件名稱

    (c)期望腳本在任何路徑都能使用(腳本放在聲明了全局環境變量的路徑)

    [root@hadoop102 ~]$ echo $PATH

    /usr/local/bin:/usr/bin:/usr/local/sbin:/usr/sbin:/home/root/.local/bin:/home/root/bin:/opt/module/jdk1.8.0_212/bin

    (3)腳本實現

    (a)在/home/root/bin目錄下創建xsync文件

    [root@hadoop102?opt]$?cd /home/root

    [root@hadoop102?~]$?mkdir bin

    [root@hadoop102?~]$?cd bin

    [root@hadoop102?bin]$?vim xsync

    在該文件中編寫如下代碼

    #!/bin/bash#1. 判斷參數個數
    if [ $# -lt 1 ]
    thenecho Not Enough Arguement!exit;
    fi#2. 遍歷集群所有機器
    for host in hadoop102 hadoop103 hadoop104
    doecho ====================  $host  ====================#3. 遍歷所有目錄,挨個發送for file in $@do#4. 判斷文件是否存在if [ -e $file ]then#5. 獲取父目錄pdir=$(cd -P $(dirname $file); pwd)#6. 獲取當前文件的名稱fname=$(basename $file)ssh $host "mkdir -p $pdir"rsync -av $pdir/$fname $host:$pdirelseecho $file does not exists!fidone
    done

    此時,我們去查看文件

    顏色是灰色的,不具備執行權限。修改腳本 xsync 具有執行權限

    chmod +x?xsync

    或者是chmod 777 xsync

    測試腳本

    [root@hadoop102?~]$?xsync /home/root/bin

    (d)將腳本復制到/bin中,以便全局調用

    [root@hadoop102?bin]$?sudo cp?xsync /bin/

    (e)同步環境變量配置(root所有者)

    [root@hadoop102 ~]$ xsync /etc/profile.d/my_env.sh

    (六)ssh命令切換主機讓環境變量生效

    從當前主機切換到另一臺主機:ssh root@192.168.10.101

    運行命令讓環境變量生效。

    source /etc/profile

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/82718.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/82718.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/82718.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Python60日基礎學習打卡D12【蟲豸版】

退火算法 物理現象:退火現象指物體逐漸降溫的物理現象,溫度愈低,物體的能量狀態會低;溫度足夠低后,液體開始冷凝與結晶,在結晶狀態時,系統的能量狀態最低。大自然在緩慢降溫(即退火)時&#xf…

1.3.1 Linux音頻框架alsa詳細介紹

ALSA作為對舊OSS系統的替代方案,始于1998年。當時OSS還閉源商業化,因此社區開始開發開源的ALSA。經過多年的發展,ALSA成為Linux內核中音頻架構的標準。 結構和架構 ALSA由以下幾個主要部分組成: 內核模塊: 這是ALSA的…

# 07_Elastic Stack 從入門到實踐(七)---1

07_Elastic Stack 從入門到實踐(七)—1 一、Filebeat入門之讀取 Nginx 日志文件 1、首先啟動 Elasticsearch 集群 和 Nginx 服務,打開GoogleChrome 瀏覽器,點擊 elasticsearch-head 插件,連接Elasticsearch 集群 服務器。 # 查看網卡名 $ ip addr# 修改網卡配置,改為…

BUUCTF 大流量分析(三) 1

BUUCTF:https://buuoj.cn/challenges 文章目錄 題目描述:密文:解題思路:flag: 相關閱讀 CTF Wiki BUUCTF | 大流量分析 (一)(二)(三) 題目描述: …

數據庫的進階操作

目錄 1、數據庫的約束 2、查詢操作的進階 2.1 查詢插入 2.2 聚合查詢 2.3 運算查詢 2.3 分組查詢 2.4 聯合查詢 2.5 內外連接 2.6 子查詢 2.7 合并查詢 1、數據庫的約束 數據庫的約束是指:數據庫會自動的對數據的合法性進行校驗和檢查的一系列操作的機制&a…

.Net HttpClient 使用請求數據

HttpClient 使用請求數據 0、初始化及全局設置 //初始化:必須先執行一次 #!import ./ini.ipynb1、使用url 傳參 參數放在Url里,形如:http://www.baidu.com?namezhangsan&age18, GET、Head請求用的比較多。優點是簡單、方便&#xff0…

Qt還有希望嗎

🚀2025 年 Qt 框架價值大揭秘!會持續閃耀嗎? 寶子們,今天來聊聊 Qt 框架在 2025 年的價值走向,這可是跨平臺應用開發的寶藏工具呀! 🌟核心優勢穩穩拿捏Qt 的跨平臺能力絕了! Windows…

Redis設計與實現——數據結構與對象

簡單動態字符串(SDS) SDS 的結構定義 len:記錄當前字符串的實際長度(不包含 \0),獲取長度的時間復雜度為 O(1)。free:記錄未使用的空間大小,用于優化內存分配。buf[]:實…

NeurIPS 2025 截稿攻略

會議資訊 NeurIPS,全稱神經信息處理系統大會,是一個關于機器學習和計算神經科學的國際會議。NeurIPS是CCF(計算機學會)推薦的A類會議!是機器學習領域內最具難度、水平最高且影響力最強的會議之一。它與ICML&#xff0…

Java中堆棧

文章目錄 Java中堆棧1. 棧(Stack)特點示例 2. 堆(Heap)特點示例 3. 核心區別4. 常見問題5. 內存可視化示例內存布局示意圖: 總結 Java中堆棧 在 Java 中,“堆棧” 通常指的是堆(Heap&#xff0…

【類拷貝文件的運用】

常用示例 當我們面臨將文本文件分成最大大小塊的時,我們可能會嘗試編寫如下代碼: public class TestSplit {private static final long maxFileSizeBytes 10 * 1024 * 1024; // 默認10MBpublic void split(Path inputFile, Path outputDir) throws IOException {…

打破產品思維--被討厭的勇氣--實戰5

課程:B站大學 記錄產品經理實戰項目系統性學習,從產品思維,用戶畫像,用戶體驗,增長數據驅動等不同方向理解產品,從0到1去理解產品從需求到落地的全過程,測試左移方向(靠近需求、設計…

【Autosar SecOC 1.信息安全原理介紹】

這里寫目錄標題 1 背景2 了解黑客攻擊原理3 SecOC實現數據的真實性與完整性校驗3.1 數據身份驗證完成真實性驗證3.2 防止重放攻擊 1 背景 在今天的車載網絡中,大部分數據傳輸是在沒有任何特殊安全措施的情況下進行的。因此,一旦能夠直接訪問車輛的總線&a…

基于SpringBoot的校園周邊美食探索及分享平臺【附源碼+數據庫+文檔下載】

一、項目簡介 本項目是一個基于 SpringBoot Vue 的校園周邊美食探索與分享平臺,專為在校大學生開發,集美食推薦、好友互動、收藏分享于一體。 通過平臺,用戶可以探索學校周邊的美食店鋪、發布美食鑒賞、添加好友進行交流分享。同時&#x…

無償幫寫畢業論文

以下教程教你如何利用相關網站和AI免費幫你寫一個畢業論文。畢竟畢業論文只要過就行,脫產學習這么多年,終于熬出頭了,完成畢設后有空就去多看看親人好友,祝好! 一、找一個論文模板(最好是overleaf) 廢話不多說&#…

15 個 Azure DevOps 場景化面試問題及解答

問題 1. 解釋 Azure DevOps YAML 管道的典型結構。 您可以從管道的整體結構開始,從觸發器開始。您也可以選擇解釋它可能包含的不同類型的階段:構建、測試、掃描、部署等。 Azure DevOps YAML 管道結構示例 觸發器指示管道運行。它可以是持續集成 (CI) 或…

Java 大視界 -- Java 大數據機器學習模型在元宇宙虛擬場景智能交互中的關鍵技術(239)

💖親愛的朋友們,熱烈歡迎來到 青云交的博客!能與諸位在此相逢,我倍感榮幸。在這飛速更迭的時代,我們都渴望一方心靈凈土,而 我的博客 正是這樣溫暖的所在。這里為你呈上趣味與實用兼具的知識,也…

本地不安裝oracle,還想連oracle

1.首先要用navicat,或者toad打開連接數據庫 2.安裝oracle客戶端,有時候OCI.dll需要看數據庫版本,我們Oracle數據庫是12C,可以用這個版本 3. 4.配置環境變量 變量名:NLS_LANG變量值:SIMPLIFIED CHINESE_CHINA.ZHS16GBK …

LabVIEW車牌自動識別系統

在智能交通快速發展的時代,車牌自動識別系統成為提升交通管理效率的關鍵技術。本案例詳細介紹了基于 LabVIEW 平臺,搭配大恒品牌相機構建的車牌自動識別系統,該系統在多個場景中發揮著重要作用,為交通管理提供了高效、精準的解決方…

deque底層數據結構以及和queue的異同

文章目錄 底層數據結構原理關鍵組成部分操作效率與其他容器的對比適用場景C STL中的實現細節總結 deque和queue的異同相同點不同點 deque(雙端隊列)是一種具有高效兩端插入和刪除操作的數據結構,常見于C標準庫(STL)和其…