大數據學習1：Hadoop單機版環境搭建

大數據學習1：Hadoop單機版環境搭建

bicheng/2025/7/11 20:24:07/文章來源:https://blog.csdn.net/m0_46266496/article/details/149134786

1.基礎知識介紹?

Flume采集日志。Sqoop采集結構化數據，比如采集數據庫。

存儲到HDFS上。

YARN資源調度，每臺服務器上分配多少資源。

Hive是基于Hadoop的一個數據倉庫工具，提供SQL查詢功能，能將SQL語句轉變成MapReduce任務來執行。MapReduce將HDFS數據分割，整合鍵值對，再整到HDFS。

Spark是一款大數據處理框架，其開發初衷是改良Hadoop MapReduce的編程模型和提高運行速度。Spark主要面向批處理需求，但也支持流處理，因其優異的性能和易用的接口，Spark已經是批處理界絕對的王者。

Kafka也是一種面向大數據領域的消息隊列框架，一個企業經常拆分出很多不同的應用系統，系統之間需要建立數據流管道。

?2.具體流程

?使用虛擬機新建了centos7的linux系統，在上面部署的

一、環境準備

1.上傳下載的jdk包

?2.解壓JDK安裝包

3.配置環境變量

4.配置免密登錄，ip改成自己的ip

?二、配置Hadoop

?1.上傳下載的Hadoop包

2.進入/opt/server/hadoop-3.1.0/etc/hadoop 目錄下，修改以下配置，都是vim打開修改

?

?3.初始化并啟動HDFS

?

?

?我的是http://192.168.59.100:9870/

三、Hadoop(YARN)環境搭建

1.修改配置文件，進入/opt/server/hadoop-3.1.0/etc/hadoop 目錄下，修改以下配置

?2.啟動服務

在這個文件夾下面cd /opt/server/hadoop-3.1.0/sbin/

?

?在當前目錄下啟動

?

訪問地址為：http://192.168.59.100:8088/

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/bicheng/88220.shtml
繁體地址，請注明出處：http://hk.pswp.cn/bicheng/88220.shtml
英文地址，請注明出處：http://en.pswp.cn/bicheng/88220.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

深入理解PHP中的命名空間和自動加載機制

深入理解PHP中的命名空間和自動加載機制

首先，讓我們來討論命名空間。PHP的命名空間是一種對代碼進行邏輯分組的機制，它允許開發者將函數、類和常量封裝在不同的命名空間中。這樣做的好處在于可以避免全局范圍內的名稱沖突。例如，你可能在你的項目中使用了一個名為"Database&qu…

閱讀更多...

學習:JS[3]數組的增刪改查+函數+作用域

學習:JS[3]數組的增刪改查+函數+作用域

一.操作數組1.改2.增arr.push(新增的內容):將一個或多個元素添加到數組的結尾arr.unshift(新增的內容):方法將一個或多個元素添加到數組的開頭,并返回該數組的長度3.刪除arr.pop():方法從數組中刪除最后一個元素,不帶參數,并返回元素的值arr.shift():方法從數組中刪除第一個元素…

閱讀更多...

從0到1搭建ELK日志收集平臺

從0到1搭建ELK日志收集平臺

ELK是什么 ELK 是指 Elasticsearch、Logstash 和 Kibana 這三種工具的組合，通常用于日志分析、數據搜索和可視化。它們分別承擔不同的功能，形成了強大的數據處理和分析平臺： Elasticsearch：一個分布式搜索引擎，擅長實時…

閱讀更多...

Qt：圖片切割

Qt：圖片切割

void MainWindow::on_action_slice_triggered() {QDialog *dialog new QDialog(this);dialog->setWindowTitle("切割");dialog->setFixedSize(200, 150);QVBoxLayout *vbox new QVBoxLayout;QHBoxLayout *hbox new QHBoxLayout;QLabel *label new QLabel(&…

閱讀更多...

BabelDOC，一個專為學術PDF文檔設計的翻譯和雙語對比工具

BabelDOC，一個專為學術PDF文檔設計的翻譯和雙語對比工具

你是否也有這樣的困境，面對一篇學術論文，即使英語水平不錯，仍需反復查詞典，尤其是遇到專業術語和復雜長句，翻譯軟件又常常不能很好地處理學術PDF的排版，導致翻譯結果混亂不堪。現在，解決你煩惱…

閱讀更多...

Python之面向對象和類

Python之面向對象和類

一.類1.類的定義：class 類名：“”“注釋 ”“”pass2.實例的創建：實例類名(parameterlist)parameterlist：定義類時__init__()方法的參數，如果該方法只有一個self參數，parameterlist可以省略class Goose()…

閱讀更多...

【力扣困難 C】329. 矩陣中的最長遞增路徑

【力扣困難 C】329. 矩陣中的最長遞增路徑

目錄題目解法一題目待添加解法一 int max(int a, int b) {return a > b ? a : b; }int search(int** matrix, int m, int n, int i, int j, int (*dp)[n]) {if (dp[i][j]) {return dp[i][j];}int len 0;if (i > 0 && matrix[i - 1][j] > matrix[i]…

閱讀更多...

Blueprints - UE5的增強輸入系統

Blueprints - UE5的增強輸入系統

一些學習筆記歸檔；增強輸入系統由兩部分組成：Input Action和Input Mapping ContextInput Action是輸入操作的映射（操作中比如有移動、跳躍等），Input Mapping Context是輸入情境的映射（對各種操作的具體按鍵…

閱讀更多...

Python 【技術面試題和HR面試題】? 動態類型、運算符、輸入處理及算法編程問答

Python 【技術面試題和HR面試題】? 動態類型、運算符、輸入處理及算法編程問答

1.技術面試題 （1）TCP與UDP的區別是什么？ 答： ①連接性：TCP 面向連接，3次握手及4次揮手，建立端到端的虛鏈路像；UDP 無連接，直接發送，無需預先建立連接。 ②傳…

閱讀更多...

etcd-cpp-apiv3 二次封裝

etcd-cpp-apiv3 二次封裝

接口介紹頭文件#include <etcd/Client.hpp> #include <etcd/KeepAlive.hpp> #include <etcd/Response.hpp> #include <etcd/SyncClient.hpp> #include <etcd/Value.hpp> #include <etcd/Watcher.hpp>下面從功能介紹幾個類的概念Value &…

閱讀更多...

【網絡與系統安全】強制訪問控制——Biba模型

【網絡與系統安全】強制訪問控制——Biba模型

一、模型定義與目標提出背景：1977年由Ken Biba提出，是首個完整性安全模型，與BLP模型形成對偶（BLP關注機密性，Biba關注完整性）。核心目標：防止低完整性信息污染高完整性信息，避免未授…

閱讀更多...

從架構抽象到表達范式：如何正確理解系統架構中的 4C 模型20250704

從架構抽象到表達范式：如何正確理解系統架構中的 4C 模型20250704

🧩 從架構抽象到表達范式：如何正確理解系統架構中的 4C 模型？ “4C”到底是架構的組成結構，還是架構圖的表現方式？這類看似細節的問題，其實直擊了我們在系統設計中認知、表達與落地之間的張力。 &#x1f5…

閱讀更多...

Debian10安裝Mysql5.7.44 筆記250707

Debian10安裝Mysql5.7.44 筆記250707

Debian10安裝Mysql5.7.44 筆記250707 1?? 參考 1 在Debian 10 (Buster) 上安裝 MySQL 5.7.44 的步驟如下： 1. 添加 MySQL APT 倉庫 MySQL 官方提供了包含特定版本的倉庫： # 下載倉庫配置包 wget https://dev.mysql.com/get/mysql-apt-config_0.8.28…

閱讀更多...

20250706-6-Docker 快速入門（上）-鏡像是什么？_筆記

20250706-6-Docker 快速入門（上）-鏡像是什么？_筆記

一、鏡像是什么1. 一個分層存儲的文件，不是一個單一的文件分層結構: 與傳統ISO文件不同，Docker鏡像由多個文件組成，采用分層存儲機制存儲優勢: 每層可獨立復用，顯著減少磁盤空間占用，例如基礎層可被多個鏡…

閱讀更多...

[SystemVerilog] Clocking

[SystemVerilog] Clocking

SystemVerilog Clocking用法詳解 SystemVerilog 的 clocking 塊（Clocking Block）是一種專門用于定義信號時序行為的構造，主要用于驗證環境（如 UVM）中，以精確控制信號的采樣和驅動時序。clocking 塊通過將信…

閱讀更多...

kong網關基于header分流灰度發布

kong網關基于header分流灰度發布

kong網關基于header分流灰度發布在現代微服務架構中，灰度發布（Canary Release）已經成為一種常用且安全的上線策略。它允許我們將新版本的功能僅暴露給一小部分用戶，從而在保證系統穩定性的同時收集反饋、驗證效果、規避風險。而作…

閱讀更多...

Go語言gin框架原理

Go語言gin框架原理

在gin框架中，最關鍵的就是前綴樹，是很重要的。gin框架本質上是在http包的基礎之上，對其的一個二次封裝。這里借鑒一下小徐先生的圖，可能當前版本的gin可能內容有所改變，但大致思想還是這樣。gin框架所做的就是提供一個…

閱讀更多...

4、Sending Messages

4、Sending Messages

本節介紹如何發送消息。Using KafkaTemplate本節介紹如何使用KafkaTemplate發送消息。OverviewKafkaTemplate封裝了一個生產者，并提供了向Kafka主題發送數據的便利方法。以下列表顯示了KafkaTemplate的相關方法：CompletableFuture<SendResult<K, V…

閱讀更多...

CSS長度單位問題

CSS長度單位問題

在 CSS 中，100px 的邏輯長度在不同分辨率的手機屏幕上是否表現一致，取決于設備的像素密度（devicePixelRatio） 和視口（viewport）的縮放設置。以下是詳細分析：1. 核心概念 CSS 像素（…

閱讀更多...

基于Java+SpringBoot的圖書管理系統

基于Java+SpringBoot的圖書管理系統

源碼編號：S606源碼名稱：基于SpringBoot的圖書管理系統用戶類型：雙角色，用戶、管理員數據庫表數量：12 張表主要技術：Java、Vue、ElementUl 、SpringBoot、Maven運行環境：Windows/Mac、JDK1.8及以…

閱讀更多...

最新文章