【大數據-Hadoop】從入門到源碼編譯-概念篇

【大數據-Hadoop】從入門到源碼編譯-概念篇

  • Hadoop與大數據生態
    • (一)Hadoop是什么?
    • (二)Hadoop組成
      • 1. HDFS
        • 1.1 NameNode(nn)
        • 1.2 DataNode(dn)
        • 1.3 Secondary NameNode(2nn)
      • 2.YARN
        • 2.1 ResourceManager(RM)
        • 2.2 NodeManager(NM)
        • 2.3 ApplicationMaster(AM)
        • 2.4 Container
      • 2.MapReduce
    • (三)Hadoop發行版本
      • 1. Apache
      • 2. Cloudera(CDH)-收費
      • 3. Hortonworks(HDP,現已被Cloudera收購,推出了CDP產品)
    • (四)Hadoop優勢
      • 1. 高可靠性
      • 2. 高擴展性
      • 3. 高效性
      • 4. 高容錯性
    • (五)大數據生態體系

文章已收錄至https://lichong.work,轉載請注明原文鏈接。
ps:歡迎關注公眾號“Fun肆編程”或添加我的私人微信交流經驗🤝

Hadoop與大數據生態

(一)Hadoop是什么?

1)是Apache基金會開發的分布式系統基礎架構。
2)解決海量數據的存儲計算問題。
3)廣義上講,Hadoop更是一個生態圈!

(二)Hadoop組成

1.x

  • Common(輔助工具)
  • HDFS(數據存儲)
  • MapReduce(計算+資源調度)

2.x & 3.x

  • Common(輔助工具)
  • HDFS(數據存儲)
  • MapReduce(計算)
  • YARN(資源調度)

1. HDFS

1.1 NameNode(nn)

存儲文件的元數據,如文件名、文件目錄結構、文件屬性(生成時間、副本數、文件權限)、以及每個文件的塊列表和塊所在的DataNode等。

1.2 DataNode(dn)

在本地文件系統存儲文件塊數據,以及塊數據的校驗和。

1.3 Secondary NameNode(2nn)

用來監控HDFS狀態的輔助后臺程序,每隔一段時間獲取HDFS元數據的快照。

2.YARN

2.1 ResourceManager(RM)

1)處理客戶端請求
2)監控NodeManager
3)啟動或監控ApplicationMaster(對應執行Job)
4)資源的分配與調度

2.2 NodeManager(NM)

1)管理單個節點上的資源
2)處理來自ResourceManager的命令
3)處理來自ApplicationMaster的命令

2.3 ApplicationMaster(AM)

1)負責數據的切分
2)為應用程序申請資源并分配給內部的任務
3)任務的監控與容錯

2.4 Container

是YARN中的資源抽象,它封裝了某個節點上的多維度資源,如內存、CPU、磁盤、網絡等。

2.MapReduce

Map階段:并行處理輸入數據
Reduce階段:對Map結果進行匯總
在這里插入圖片描述

(三)Hadoop發行版本

1. Apache

2006年推出
原始的基礎版本,對于入門學習最好。

2. Cloudera(CDH)-收費

2009年Hadoop創始人加入后推出,現在收費,更加穩定。

3. Hortonworks(HDP,現已被Cloudera收購,推出了CDP產品)

2011年成立,吸納Hadoop的雅虎程序員貢獻了80%的Hadoop代碼,文檔較好,Hortonworks Data Platform(HDP)還包括了Ambari(開源的安裝和管理系統)。

(四)Hadoop優勢

1. 高可靠性

底層有多個數據副本,即使存儲故障,也不會導致數據丟失

2. 高擴展性

可以動態增加服務器

3. 高效性

并行工作(MapReduce思想)

4. 高容錯性

可以自動把失敗任務重新分配

(五)大數據生態體系

在這里插入圖片描述

文章已收錄至https://lichong.work,轉載請注明原文鏈接。
ps:歡迎關注公眾號“Fun肆編程”或添加我的私人微信交流經驗🤝

~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~往期精選🪶~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

【Docker】入門教程-基本概念解讀
【前端-React Native】移動端原生開發整合React Native Elements教程-安卓示例
【前端-開發環境】使用NVM實現不同nodejs版本的自由切換(NVM完整安裝使用手冊)
【前端-NPM私服】內網使用verdaccio搭建私有npm服務器
【前端-IE兼容】Win10和Win11使用Edge調試前端兼容IE6、IE7、IE8、IE9、IE10、IE11問題
【前端-工程化】React項目工程化記錄-內置項目活文檔(老項目升級優化-集成Hosky/ESLint/Prettier-升級Webpack/Babel/NodeSass/React)
【工具-TWRP-frp-Termux】舊手機暴改成免費云服務器-MIUI刷TWRP安裝magisk獲取root
【工具-Shell腳本】java程序產品包模板-linux和windows通用shell啟動停止腳本(無需系統安裝Java運行環境)
【工具-Nginx】從入門安裝到高可用集群搭建
【工具-Nginx】Nginx高性能通用配置文件-注釋版-支持防刷限流、可控高并發、HTTP2、防XSS、Gzip、OCSP Stapling、負載、SSL
【工具-WireShark】網絡HTTP抓包使用教程
【后端-maven打包】通過profile標簽解決同時打jar包 war包需求
【架構-DDD】使用領域驅動設計-互聯網未來架構設計之道(一)
【后端-SpringCache】基于Spring Cache封裝一個能夠批量操作的Redis緩存記錄下踩坑歷程(pipeline或mget封裝)
【后端-SkyWalking】SkyWalking前后端開發環境搭建詳細教程步驟-6.x/7.x/8.x版本通用-插件二次開發利器(一)
【后端-Quartz】Springboot整合Quartz支持集群環境-設計業務與框架分離及實現定時任務調度

?歡迎為耿直少年點贊、關注、收藏!!!

👇👇👇

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/210726.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/210726.shtml
英文地址,請注明出處:http://en.pswp.cn/news/210726.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

記一次堆內外內存問題的排查和優化

為優化淘寶帶寬成本,我們在網關 SDK(Java)統一使用 ZSTD 替代 GZIP 壓縮以獲取更高的壓縮比,從而得到更小的響應包。具體實現采用官方推薦的 zstd-jni 庫。zstd-jni 會調用 zstd 的 c 庫。 背景 在性能壓測和優化過程中&#xff0…

React和Preact 這樣處理className更優雅

React和Preact寫className,我不太習慣使用模板字符串,不好看,看起來也不直觀,寫了如下兩個庫: react-runtime-clsx 和 preact-runtime-clsx,來輔助開發,可以更方便的處理className的問題&#x…

nodejs微信小程序+python+PHP北京地鐵票務APP-計算機畢業設計推薦 -安卓

目 錄 摘 要 I ABSTRACT II 目 錄 II 第1章 緒論 1 1.1背景及意義 1 1.2 國內外研究概況 1 1.3 研究的內容 1 第2章 相關技術 3 2.1 nodejs簡介 4 2.2 express框架介紹 6 2.4 MySQL數據庫 4 第3章 系統分析 5 3.1 需求分析 5 3.2 系統可行性分析 5 3.2.1技術可行性:…

STM32F103

提示:來源正點原子,參考STM32F103 戰艦開發指南V1.3PDF資料 文章目錄 前言一、pandas是什么?二、使用步驟 1.引入庫2.讀入數據總結 前言 提示:這里可以添加本文要記錄的大概內容: 開發環境硬件普中科技,接…

C++相關閑碎記錄(6)

1、使用shared_ptr #include <iostream> #include <memory> #include <set> #include <deque> #include <algorithm> #include <string>class Item { private:std::string name;float price; public:Item(const std::string& n, floa…

【Centos】

一、Virtualbox安裝Centos 1、Virtualbox 下載地址: Virtualbox 2、Centos 下載地址: Centos 3、Virtualbox安裝Centos教程 Virtualbox安裝Centos教程: Virtualbox安裝Centos教程

光學遙感顯著目標檢測初探筆記總結

目錄 觀看地址介紹什么是顯著性目標檢測根據不同的輸入會有不同的變體(顯著性目標檢測家族)目前這個領域的挑戰 技術方案論文1(2019)論文2(2021)論文3(2022) 未來展望 觀看地址 b站鏈接 介紹 什么是顯著性目標檢測 一張圖片里最吸引注意力的部分就是顯著性物體&#xff0c;…

vue3 vue-router 導航守衛 (五)

在Vue 3中&#xff0c;導航守衛仍然是一個重要的概念&#xff0c;用于在路由切換時執行一些特定的邏輯。Vue Router提供了多個導航守衛&#xff0c;包括全局守衛、路由獨享守衛和組件內守衛。可以在路由切換時執行一些特定的邏輯&#xff0c;例如身份驗證、權限控制、數據加載等…

C++STL詳解+代碼分析+典例講解

vector 的介紹&#xff1a; 1、vector是表示可變大小數組的序列容器。 2、vector就像數組一樣&#xff0c;也采用的連續空間來存儲元素&#xff0c;這也意味著可以采用下標對vector的元素進行訪問。 3、vector與普通數組不同的是&#xff0c;vector的大小是可以動態改變的。 4、…

基于物聯網的智能倉管理系統方案

基于物聯網的智能倉管理系統方案 一、項目背景 隨著企業業務的快速發展&#xff0c;傳統的人工倉庫管理方式已經無法滿足現代企業的需求。倉庫運營效率低下、貨物出入庫錯誤、庫存不準確等問題不斷涌現。因此&#xff0c;我們提出一個基于物聯網技術的智能倉管理系統方案&…

Redis 五大經典業務問題

一 緩存穿透 緩存穿透是指當請求的數據既不在緩存中也不存在于數據庫中時&#xff0c;請求會直接穿透緩存層&#xff0c;到達數據庫層。這通常是由于惡意攻擊或者程序錯誤造成的&#xff0c;比如攻擊者故意請求不存在的大量數據&#xff0c;導致緩存不命中&#xff0c;所有的請…

智能優化算法應用:基于被囊群算法3D無線傳感器網絡(WSN)覆蓋優化 - 附代碼

智能優化算法應用&#xff1a;基于被囊群算法3D無線傳感器網絡(WSN)覆蓋優化 - 附代碼 文章目錄 智能優化算法應用&#xff1a;基于被囊群算法3D無線傳感器網絡(WSN)覆蓋優化 - 附代碼1.無線傳感網絡節點模型2.覆蓋數學模型及分析3.被囊群算法4.實驗參數設定5.算法結果6.參考文…

Moco框架的搭建使用

一、前言   之前一直聽mock&#xff0c;也大致了解mock的作用&#xff0c;但沒有具體去了解過如何用工具或框架實現mock&#xff0c;以及也沒有考慮過落實mock&#xff0c;因為在實際的工作中&#xff0c;很少會考慮用mock。最近在學java&#xff0c;剛好了解到moco框架是用于…

城市基礎設施智慧路燈改造的特點

智慧城市建設穩步有序推進。作為智慧城市的基礎設施&#xff0c;智能照明是智慧城市的重要組成部分&#xff0c;而叁仟智慧路燈是智慧城市理念下的新產品。隨著物聯網和智能控制技術的飛速發展&#xff0c;路燈被賦予了新的任務和角色。除了使道路照明智能化和節能化外&#xf…

安全掃描五項簡介

目錄 安掃五項 1.代碼檢測 2.主機基線 nginx合規檢查 麒麟基線 3.WEB掃描 4.滲透測試 用戶枚舉漏洞 漏洞描述 修復建議 點擊劫持漏洞 漏洞描述 修復建議 XSS漏洞 漏洞描述 修復建議 3.主機漏洞 超高危漏洞 高危漏洞 中危漏洞 低危漏洞 信息漏洞 參考信息…

用電商API接口獲取拼多多的商品詳情數據

pinduoduo.item_get_app_pro-根據ID取商品詳情原數據 公共參數 API請求地址 名稱類型必須描述keyString是調用key&#xff08;必須以GET方式拼接在URL中&#xff09;secretString是調用密鑰api_nameString是API接口名稱&#xff08;包括在請求地址中&#xff09;[item_searc…

一步一步寫線程之一簡單的開始

一、多線程 多線程不管是在前面的文章分析中還是在網上還是大書籍上&#xff0c;學習C/C多線程編程是無法繞過的&#xff0c;即使使用別人封裝好的框架&#xff0c;包括使用STL的一些庫&#xff0c;如果僅僅是簡單的應用&#xff0c;可能也就過去了。不過&#xff0c;稍微復雜…

VBA_MF系列技術資料1-237

MF系列VBA技術資料 為了讓廣大學員在VBA編程中有切實可行的思路及有效的提高自己的編程技巧&#xff0c;我參考大量的資料&#xff0c;并結合自己的經驗總結了這份MF系列VBA技術綜合資料&#xff0c;而且開放源碼&#xff08;MF04除外&#xff09;&#xff0c;其中MF01-04屬于定…

[Linux] 用LNMP網站框架搭建論壇

一、nginx在其中工作原理 原理&#xff1a; php-fpm.conf是控制php-fpm守護進程 它是php.ini是一個php解析器 工作過程&#xff1a; 1.當客戶端通過域名請求訪問時&#xff0c;Nginx會找到對應的虛擬主機 2. Nginx將確定請求。 對于靜態請求&#xff0c;Nginx會自行處理…

結構體和位段

結構體&#xff1a; C語言中&#xff0c;我們之前使用的都是C語言中內置的類型&#xff0c;比如整形&#xff08;int&#xff09;、字符型&#xff08;char&#xff09;、單精度浮點型&#xff08;float&#xff09;等。但是我們知道&#xff0c;我們現實世界中&#xff0c;還…