一、Hadoop概述

文章目錄

  • 一、Hadoop是什么
  • 二、Hadoop發展歷史
  • 三、Hadoop三大發行版本
    • 1. Apache Hadoop
    • 2. Cloudera Hadoop
    • 3. Hortonworks Hadoop
  • 四、Hadoop優勢
    • 1. 高可靠性
    • 2. 高擴展性
    • 3. 高效性
    • 4. 高容錯性
  • 五、Hadoop 組成
    • 1. Hadoop1.x、2.x、3.x區別
    • 2. HDFS 架構概述
    • 3. YARN 架構概述
    • 4. MapReduce 架構概述
    • 5. HDFS、YARN、MapReduce 三者關系
  • 六、大數據技術生態體系
  • 七、推薦系統框架圖

一、Hadoop是什么

  1. Hadoop是一個由Apache基金會所開發的分布式系統基礎架構。
  2. 主要解決,海量數據的存儲和海量數據的分析計算問題。
  3. 廣義上來說,Hadoop通常是指一個更廣泛的概念——Hadoop生態圈。

image.png

二、Hadoop發展歷史

  1. Hadoop創始人Doug Cutting,為了實現與Google類似的全文搜索功能,他在Lucene框架基礎上進行優化升級,查詢引擎和索引引擎。
    image.png
  2. 2001年年底Lucene成為Apache基金會的一個子項目。
  3. 對于海量數據的場景,Lucene框架面對與Google同樣的困難,存儲海量數據困難,檢索海量速度慢。
  4. 學習和模仿Google解決這些問題的辦法︰微型版Nutclh。
  5. 可以說Google是Hadoop的思想之源(Google在大數據方面的三篇論文)
    5.1. GFS —>HDFS
    5.2. Map-Reduce —>MR
    5.3. BigTable —>HBase
  6. 2003-2004年,Google公開了部分GFS和MapReduce思想的細節,以此為基礎Doug Cutting等人用了2年業余時間實現了DFS和MapReduce機制,使Nutch性能飆升。
  7. 2005年Hadoop作為Lucene的子項目Nutch的一部分正式引入Apache基金會。
  8. 2006年3月份,Map-Reduce和Nutch Distributed File System (NDFS)分別被納入到Hadoop項目中,Hadoop就此正式誕生,標志著大數據時代來臨。
  9. 名字來源于Doug Cutting兒子的玩具大象
    image.png

三、Hadoop三大發行版本

Hadoop三大發行版本:Apache、Cloudera、Hortonworks。

  1. Apache版本最原始(最基礎)的版本,對于入門學習最好。2006
  2. Cloudera內部集成了很多大數據框架,對應產品CDH。2008
  3. Hortonworks文檔較好,對應產品HDP。2011

Hortonwork

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/64105.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/64105.shtml
英文地址,請注明出處:http://en.pswp.cn/web/64105.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

python版本的Selenium的下載及chrome環境搭建和簡單使用

針對Python版本的Selenium下載及Chrome環境搭建和使用,以下將詳細闡述具體步驟: 一、Python版本的Selenium下載 安裝Python環境: 確保系統上已經安裝了Python 3.8及以上版本。可以從[Python官方網站]下載并安裝最新版本的Python,…

vue---- H5頁面 pdf,docx,excel文件預覽下載功能

vue---- H5頁面 pdf,docx,excel文件預覽&&下載功能 pdf,docx,excel文件預覽&&下載適用于vue2和vue3,示例為vue3 1.npm下載這些文件的插件(選擇自己需要預覽的進行下載) 安裝pd…

vue3和springboot使用websocket通信

前端端口&#xff1a;9090 后端端口&#xff1a;8080 vue3 引入依賴&#xff1a; npm install sockjs-client stomp/stompjs vue頁面 <template><div><h1>WebSocket 示例</h1><button click"sendMessage">發送消息</button>…

【時時三省】(C語言基礎)動態內存函數malloc

山不在高&#xff0c;有仙則名。水不在深&#xff0c;有龍則靈。 ----CSDN 時時三省 malloc 開辟內存塊 使用格式 void *malloc&#xff08;size_t sie&#xff09;&#xff1b; 示例 10*sizeof(int&#xff09;就是開辟空間的大小 如果p是void指針的話 p不能解引用 m…

c#多線程之生產者-消費者模型

在 C# 中實現 生產者-消費者模式&#xff0c;通常需要多個線程來處理數據的生產和消費。我們可以使用 Queue<T> 來作為存儲數據的隊列&#xff0c;并使用 Thread、Mutex 或 Monitor 來確保線程安全。BlockingCollection<T> 是 C# 提供的一個線程安全的集合&#xf…

選煤廠可視化技術助力智能化運營

通過圖撲 HT 可視化搭建智慧選煤廠管理平臺&#xff0c;優化了選煤生產流程&#xff0c;提高了資源利用率和安全性&#xff0c;助力企業實現智能化運營和可持續發展目標。

【論文筆記】Visual Alignment Pre-training for Sign Language Translation

&#x1f34e;個人主頁&#xff1a;小嗷犬的個人主頁 &#x1f34a;個人網站&#xff1a;小嗷犬的技術小站 &#x1f96d;個人信條&#xff1a;為天地立心&#xff0c;為生民立命&#xff0c;為往圣繼絕學&#xff0c;為萬世開太平。 基本信息 標題: Visual Alignment Pre-tra…

深入淺出 MyBatis | CRUD 操作、配置解析

3、CRUD 3.1 namespace namespace 中的包名要和 Dao/Mapper 接口的包名一致&#xff01; 比如將 UserDao 改名為 UserMapper 運行發現抱錯&#xff0c;這是因為 UserMapper.xml 中沒有同步更改 namespace 成功運行 給出 UserMapper 中的所有接口&#xff0c;接下來一一對…

前端:改變鼠標點擊物體的顏色

需求&#xff1a; 需要改變圖片中某一物體的顏色&#xff0c;該物體是純色&#xff1b; 鼠標點擊哪個物體&#xff0c;哪個物體的顏色變為指定的顏色&#xff0c;利用canvas實現。 演示案例 代碼Demo <!DOCTYPE html> <html lang"en"><head>&l…

遞歸算法常見問題(Java)

問題&#xff1a;斐波那契數列,第1項和第2項都為1&#xff0c;后面每一項都為相鄰的前倆項的和,求第n個數 解法&#xff1a;每一個數都為前倆個數之和&#xff0c;第1項和第2項都為1&#xff0c;所以寫 方法f1(n)即為求第n個數&#xff0c;那么f1(n-1)為求第n-1個數&#xff0…

git自動壓縮提交的腳本

可以將當前未提交的代碼自動執行 git addgit commitgit squash Git 命令安裝指南 1. 創建腳本目錄 如果目錄不存在&#xff0c;創建它&#xff1a; mkdir -p ~/.local/bin2. 創建腳本文件 vim ~/.local/bin/git-squash將完整的腳本代碼復制到此文件中。 3. 設置腳本權限…

C項目 天天酷跑(下篇)

上篇再博客里面有&#xff0c;接下來我們實現我們剩下要實現的功能 文章目錄 碰撞檢測 血條的實現 積分計數器 前言 我們現在要繼續優化我們的程序才可以使這個程序更加的全面 碰撞的檢測 定義全局變量 實現全局變量 void checkHit() {for (int i 0; i < OBSTACLE_C…

論文解讀——掌紋生成網絡 RPG-Palm升級版PCE-Palm

該文章是2023年論文RPG-Palm的升級版 論文&#xff1a;PCE-Palm: Palm Crease Energy Based Two-Stage Realistic Pseudo-Palmprint Generation 作者&#xff1a;Jin, Jianlong and Shen, Lei and Zhang, Ruixin and Zhao, Chenglong and Jin, Ge and Zhang, Jingyun and Ding,…

代碼隨想錄算法【Day2】

Day2 1.掌握滑動窗口法 2.模擬題&#xff0c;堅持循環不變量原則 209 長度最小的子數組 暴力法&#xff1a; class Solution { public:int minSubArrayLen(int target, vector<int>& nums) {//暴力法int i, j; //i代表起始點&#xff0c;j代表終止點int sum; //…

android——屏幕適配

一、屏幕適配的重要性 在 Android 開發中&#xff0c;屏幕適配是非常關鍵的。因為 Android 設備具有各種各樣的屏幕尺寸、分辨率和像素密度。如果沒有進行良好的屏幕適配&#xff0c;應用可能會出現顯示不完整、元素拉伸或壓縮變形、字體大小不合適等問題&#xff0c;極大地影響…

oscp學習之路,Kioptix Level2靶場通關教程

oscp學習之路&#xff0c;Kioptix Level2靶場通關教程 靶場下載&#xff1a;Kioptrix Level 2.zip 鏈接: https://pan.baidu.com/s/1gxVRhrzLW1oI_MhcfWPn0w?pwd1111 提取碼: 1111 搭建好靶場之后輸入ip a看一下攻擊機的IP。 確定好本機IP后&#xff0c;使用nmap掃描網段&…

第二十六周機器學習筆記:PINN求正反解求PDE文獻閱讀——正問題

第二十六周周報 摘要Abstract文獻閱讀《Physics-informed neural networks: A deep learning framework for solving forward and inverse problems involving nonlinear partial differential equations》1. 引言2. 問題的設置3.偏微分方程的數據驅動解3.1 連續時間模型3.1.1 …

【安全編碼】Web平臺如何設計防止重放攻擊

我們先來做一道關于防重放的題&#xff0c;答案在文末 防止重放攻擊最有效的方法是&#xff08; &#xff09;。 A.對用戶密碼進行加密存儲使用 B.使用一次一密的加密方式 C.強制用戶經常修改用戶密碼 D.強制用戶設置復雜度高的密碼 如果這道題目自己拿不準&#xff0c;或者…

中關村科金智能客服機器人如何解決客戶個性化需求與標準化服務之間的矛盾?

客戶服務的個性化和標準化之間的矛盾一直是一個挑戰。一方面&#xff0c;企業需要提供標準化的服務以保持運營效率和成本控制&#xff1b;另一方面&#xff0c;為了提升客戶滿意度和忠誠度&#xff0c;企業又必須滿足客戶的個性化需求。為此&#xff0c;中關村科金推出了智能客…

OPPO Android面試題及參考答案 (上)

性能優化方面,講一下圖片內存占用計算,以及如何避免持有不必要的引用。 在 Android 中,計算圖片內存占用主要與圖片的尺寸和像素格式有關。對于一張位圖(Bitmap),其內存占用大小可以通過以下方式估算:內存占用 = 圖片寬度 圖片高度 每個像素占用字節數。例如,常見的 …