一文搞懂什么是Hadoop

Hadoop概念

什么是Hadoop

Hadoop是一個由Apache基金會所開發的用于解決海量數據的存儲及分析計算問題分布式系統基礎架構

廣義上來說,Hadoop通常指一個跟廣泛的概念——Hadoop生態圈。

以下是hadoop生態圈中的技術:

Hadoop優勢

hadoop組成

HDFS架構概述

HDFS(Hadoop Distributed File System)是一個分布式文件系統,用于存儲文件,通過目錄樹來定位文件。

  • NameNode(nn):存儲文件元數據,比如文件名、目錄結構、文件屬性(生成時間、副本數、文件權限),以及每個文件的數據塊(Block)列表和數據庫映射信息(比如塊所在哪幾個DataNote)等。
  • DataNode(dn):在本地文件系統存儲文件塊數據,以及塊數據的校驗和;執行數據塊的讀寫操作。
  • Secondary NameNode(2nn):定期備份NameNode元數據;在緊急情況下,可輔助恢復NameNode。

HDFS 優缺點

HDFS 的使用場景:適合一次寫入,多次讀出的場景。一個文件經過創建、寫入和關閉之后就不需要改變

YARN架構概述

YARN(Yet Another Resource Negotiator)是一個資源調度平臺,負責為運算程序提供服務器運算資源。

  • ResourceManager(RM):核心管理服務,負責資源的管理和分配。
  • NodeManager(NM):管理單個節點上的資源。
  • ApplicationMaster(AM):負責內部任務的資源申請和分配;任務的監控和容錯。
  • Container:容器,里面封裝了任務運行所需要的資源。

MapReduce架構概述

MapReduce 是一個分布式運算程序的編程框架,是用戶開發“基于 Hadoop 的數據分析應用”的核心框架。
MapReduce 核心功能是將用戶編寫的業務邏輯代碼和自帶默認組件整合成一個完整的分布式運算程序,并發運行在一個 Hadoop 集群上。

MapReduce將計算過程分為兩個階段:Map和Reduce。

  • Map 階段并行處理輸入數據;
  • Reduce 階段對 Map 結果進行匯總。

HDFS、YARN、MapReduce三者關系

Hadoop運行環境集群部署采用了三臺服務器,以下是集群部署規劃:

注意:

  • NameNode 和 SecondaryNameNode 不要安裝在同一臺服務器
  • ResourceManager 也很消耗內存,不要和 NameNode、SecondaryNameNode 配置在同一臺機器上。

本文由mdnice多平臺發布

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/207745.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/207745.shtml
英文地址,請注明出處:http://en.pswp.cn/news/207745.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

一個不錯的文章偽原創系統程序源碼

一款文章偽原創系統程序源碼免費分享,程序是站長原創的。 一共花了站長幾天時間寫的這個文章偽原創平臺,程序無需數據庫。 程序前端采用BootStrap框架搭建,后端采用PHP原生書寫。 前端偽原創采用Ajax無刷新提交,Ajax轉換到詞庫…

TCPUDP使用場景討論

將鏈路從TCP改為UDP會對通信鏈路產生以下影響和注意事項: 可靠性:UDP是無連接的協議,與TCP相比,它不提供可靠性保證和重傳機制。因此,當將鏈路從TCP改為UDP時,通信的可靠性會降低。如果在通信過程中丟失了U…

【爬取二手車并將數據保存在數據庫中】

爬取二手車并將數據保存在數據庫中 查看網頁結構分析爬取步驟解密加密信息將密文解密代碼: 進行爬取:爬取函數寫入解密文件函數和獲取城市函數解密文件,返回正確字符串函數保存到數據庫 運行結果 查看網頁結構分析爬取步驟 可以看出網頁使用…

C 語言 變量

變量初始值 全局變量:初始值是 0 局部變量:初始值是 隨機的 類型限定符 通常不需要顯式使用 register 關鍵字來優化變量的存儲和訪問。 關鍵字 _Complex和_Imaginary分別用于表示復數和虛數(二者皆是數學概念) 變量的聲明和定義 c…

蘋果 macOS 14.1.2 正式發布 更新了哪些內容?

蘋果今日向 Mac 電腦用戶推送了 macOS 14.1.2 更新(內部版本號:23B92 | 23B2091),本次更新距離上次發布隔了 28 天。 需要注意的是,因蘋果各區域節點服務器配置緩存問題,可能有些地方探測到升級更新的時間略…

webWorker解決單線程中的一些小問題和性能優化

背景 js是單線程這是大家都知道,為了防止多個線程同時操作DOM,這個導致一個復雜的同步問題。比如,假定JavaScript同時有兩個線程,一個線程在某個DOM節點上添加內容,另一個線程刪除了這個節點,這時瀏覽器應…

全局平均池化的示例

1.對一個3通道,5*5的矩陣,進行全局平均池化 每個矩陣的大小都是 5x5,假設這些矩陣代表一幅圖像的三個不同通道。為簡單起見,我們將這三個矩陣分別稱為 A、B 和 C。合成圖像將是一個三通道圖像,每個通道由其中一個矩陣…

計算機方向的一些重要縮寫和簡介

參考: 深度學習四大類網絡模型 干貨|機器學習超全綜述! 機器學習ML、卷積神經網絡CNN、循環神經網絡RNN、馬爾可夫蒙特卡羅MCMC、生成對抗網絡GAN、圖神經網絡GNN——人工智能經典算法 MLP(Multi Layer Perseption)用在神經網絡中…

這是最后的戰役了

不變因子 初等因子 行列式因子 smith標準型 酉矩陣 H-陣等等 A H A A^H A AHA 就是 H-陣 正定H陣的性質 若 A A A 為正定的H-陣. 存在可逆矩陣 Q Q Q, 使得 A Q H Q AQ^H Q AQHQ.存在 P P P, 使得 P H A P I P^HAPI PHAPI.A的特征值大于0. Q ? 1 A Q Q^{…

駕馭蘋果的人工智慧模式:克服反擊與應對挑戰

蘋果一年一度的秋季「春晚」時間越來越近,但在大模型浪潮下,蘋果何時推出自己的「蘋果GPT」成了另一個關注的話題。 畢竟,前有華為,后有小米,在中國手機廠商爭相將大模型裝進移動終端的同時,蘋果卻依舊對A…

微服務學習:Ribbon實現客戶端負載均衡,將請求分發到多個服務提供者

Ribbon是Netflix開源的一個基于HTTP和TCP客戶端負載均衡器。它主要用于在微服務架構中實現客戶端負載均衡,將請求分發到多個服務提供者上,從而實現高可用性和擴展性。 Ribbon的主要特點包括: 客戶端負載均衡:Ribbon是一個客戶端負…

【算法題】找出符合要求的字符串子串(js)

題解: function solution(str1, str2) {const set1 new Set([...str1]);const set2 new Set([...str2]);return [...set1].filter((item) > set2.has(item)).sort();}console.log(solution("fach", "bbaaccedfg"));//輸入:fach// bbaacced…

手機上寫工作總結用什么軟件好?借助工作筆記輕松寫出優秀年終總結

隨著年底的臨近,撰寫個人年終工作總結成為了許多職場人士的重要任務。因為手機是每個上班族都要隨身攜帶的電子設備,所以想要抽時間來寫年終工作總結,使用手機是比較便捷的。那么,在手機上寫工作總結應該使用什么軟件呢&#xff1…

Linux 環境下的性能測試——top與stress

對于Linux 環境,top命令是使用頻繁且信息較全的命令, 它對于所有正在運行的進行和系統負荷提供實時更新的概覽信息。stress是個簡單且全面的性能測試工具。通過它可以模擬各種高負載情況。 通過top與stress這兩個命令的結合使用,基本可以達到…

軟件測試——單元測試

單元測試是軟件開發中的一種測試方法,用于驗證軟件中的各個獨立單元(通常是函數、方法或類)是否按照設計規范正常工作。以下是進行單元測試的一般步驟和最佳實踐: 1. 選擇測試框架 選擇適合項目的測試框架,例如&…

SHAP:Python的可解釋機器學習庫

SHAP:Python的可解釋機器學習庫 一、概念二、步驟三、代碼-以波士頓房價為例summary_plotFeature Importanceshap_interaction_valuesdependence_plot完整代碼一、概念 SHAP(Shapley Additive Explanations)模型是一種用于解釋機器學習模型預測結果的方法。它基于合作博弈論…

【C++】類和對象——explicit關鍵字,友元和內部類

這篇博客已經到了類和對象的最后一部分了&#xff0c;下面我們先看一下explicit關鍵字 我們還是先來引入一個例子&#xff0c;我們的代碼是可以這么寫的 class A { public:A(int aa 0) {_a aa;cout << "A(int aa 0)" << endl;} private:int _a; }; i…

紅隊攻防實戰之Redis-RCE集錦

心若有所向往&#xff0c;何懼道阻且長 Redis寫入SSH公鑰實現RCE 之前進行端口掃描時發現該機器開著6379&#xff0c;嘗試Redis弱口令或未授權訪問 嘗試進行連接Redis&#xff0c;連接成功&#xff0c;存在未授權訪問 嘗試寫入SSH公鑰 設置redis的備份路徑 設置保存文件名 …

[GXYCTF2019]禁止套娃1

提示 git泄露無參數rce &#xff01;&#xff01;注意需要python3環境 github里dirsearch工具下載位置 ###可能需要開節點才能打開 百度網盤dirsearch下載地址 ###如果github里下載不了可以在網盤下載 提取碼sx5d 只給了flag在哪里呢&#xff0c;那么應該就是要讓…

Java參數校驗詳解:使用@Valid注解和自定義注解進行參數驗證

很多時候我們需要使用不少if、else等等邏輯判斷及驗證&#xff0c;這樣在進行一些重復的參數校驗會很麻煩&#xff0c;且以后要維護也會吃力。 而這樣就可以使用javax.validation。驗證&#xff08;Validation&#xff09;常見的驗證操作包括驗證數據的類型、格式、長度、范圍、…