hadoop家族的各個成員

hadoop家族的各個成員

news/2025/8/19 9:44:43/文章來源:https://blog.csdn.net/weixin_30563319/article/details/95400456

這篇文章不提原理，講講hadoop及其周邊項目的作用。

hadoop這個詞已經流行好多年了，一提到大數據就會想到hadoop，那么hadoop的作用是什么呢？

官方定義：hadoop是一個開發和執行處理大規模數據的軟件平臺。核心詞語是平臺，也就是說我們有大量的數據，又有好幾個電腦，我們知道應該把處理數據的任務分解到各個電腦上，可是不知道如何分配任務，如何回收結果，hadoop大概就幫助我們做了這件事。

1HDFS

我們首先應該考慮的是海量數據怎么保存，怎么管理。這就有了分布式文件系統，HDFS。

2Map-Reduce

數據保存后，我們如何處理這些數據呢，假設我處理的方法復雜，而不不過排序，查找這種操作怎么辦？須要有一個可以提供編寫代碼的地方，讓我們自己寫出操作，它內部再進行分解，分配，回收數據等等。

3Hive

能編代碼是好的，但編代碼太麻煩，并且數據庫人員是熟悉SQL語句的，能用SQL語句處理，就不用Map-Reduce了吧，所以出現了Hive。并且大數據不管怎樣是離不開數據庫，離不開表，Hive就能講數據映射成數據表，然后再操作就方便了，它的缺點是速度較慢。

4HBase

既然Hive的速度較慢，那么有沒有較快的數據庫呢？HBase就是，他為查詢而生的，查詢的速度非常快。

5Sqoop

曾經不是有非常多有名的數據庫像MySQL，Oracle，我數據都是存在這里面的，怎么導入到HDFS中呢？Sqoop提供了關系型數據庫和HDFS之間的相互轉換。

6Flume

在這么多電腦上工作，假設當中一臺有點問題，或者上面哪個服務有點問題，如何知道哪壞了呢？Flume提供了一個高可靠的日志採集系統。

7Mahout

處理大數據非常多是用來進行數據挖掘，有那幾種常見的機器學習算法，既然算法都固定了并且就那幾種，那就開發個叫Mahout的東西實現各種算法，開發者就能更快捷的使用。

8Zookeeper

ZooKeeper的目標是封裝好復雜易出錯的關鍵服務，將簡單易用的接口和性能高效、功能穩定的系統提供給用戶。說白了就是動物園管理員，他是用來來管大象(Hadoop)?、?蜜蜂(Hive)的。

以上是Hadoop家族的主要成員，還有幾個不經常使用的就不用介紹了，知道這些成員的作用后，對Hadoop總體能干什么就有了初步的認識，剩下的就是慢慢學習各個部分的原理和用法了。

轉載于:https://www.cnblogs.com/yxwkf/p/3849348.html

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/news/273656.shtml
繁體地址，請注明出處：http://hk.pswp.cn/news/273656.shtml
英文地址，請注明出處：http://en.pswp.cn/news/273656.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

ArrayList 源碼分析

ArrayList 源碼分析

介紹 ArrayList 是一個數組隊列，相當于動態數組。與Java中的數組相比，它的容量能動態增長。結構 ArrayList繼承于AbstractList，實現了List, RandomAccess, Cloneable, java.io.Serializable這些接口。如下圖： public class Arra…

閱讀更多...

Poj 1556 The Doors 計算幾何+最短路

Poj 1556 The Doors 計算幾何+最短路

其實本題非常的無腦，無腦拍完1A，寫到blog里只因為TM無腦拍也拍了很久啊 #include <cstdio> #include <cstring> #include <cmath> #include <algorithm> #include <climits> #include <string> #include <iostr…

閱讀更多...

String equals()方法源碼分析

String equals()方法源碼分析

public boolean equals(Object anObject) {// :比較的引用類型，比較的是地址值是否相同if (this anObject) { //地址值相等，返回truereturn true;}// instanceOf判斷一個對象是不是某個類型的實例if (anObject instanceof String) {String anotherStrin…

閱讀更多...

Google,真的要離我們而去嗎？

Google,真的要離我們而去嗎？

Google,真的要離我們而去嗎？ 好懷念，真正要解決問題，還得搜google!轉載于:https://www.cnblogs.com/fuyujian/p/3852444.html

閱讀更多...

Oracle 位圖索引

Oracle 位圖索引

內容簡介: 1.位圖索引 1.1位圖索引使用注意事項; 1.2 使用位圖索引; 1.3 位圖索引對DML操作的影響; 2.位圖連接索引 2.1 明確需求后使用位圖索引; 2.1創建位圖連接索引的注意事項: 1.位圖索引: 1.1位圖索引使用注意事項: ? 一般適用于低基數列; ? 適合數據倉庫; ? 對于啟用位…

閱讀更多...

oracle服務器和客戶端字符集的查看和修改

oracle服務器和客戶端字符集的查看和修改

一、什么是oracle字符集 Oracle字符集是一個字節數據的解釋的符號集合,有大小之分,有相互的包容關系。ORACLE 支持國家語言的體系結構允許你使用本地化語言來存儲，處理，檢索數據。它使數據庫工具，錯誤消息，排序次序，日…

閱讀更多...

Java 按位運算符(,|,^,,)

Java 按位運算符(,|,^,,)

&(按位與) 定義：針對二進制，只要有一個為0，就為0。2 & 5 02的二進制：00000000 00000000 00000000 000000105的二進制：00000000 00000000 00000000 00000101 |(按位或) 定義：針對二進制&#xff0c…

閱讀更多...

Oracle 多行合并一行方法

Oracle 多行合并一行方法

假如有如下表，其中各個i值對應的行數是不定的 Sql代碼 SQL> select * from t; I A D ---------- ---------- ------------------- 1 b 2008-03-27 10:55:42 1 a 2008-03-27 10:55:46 1…

閱讀更多...

Docker 簡單入門(一)

Docker 簡單入門(一)

Docker 簡介 Docker是一個開源的容器引擎，它有助于更快地交付應。Docker可將應用程序和基礎設施層隔離，并且能將基礎設施當作程序-樣進行管理。使用Docker，可更快地打包、測試以及部署應用程序,并可以縮短從編寫到部署運行代碼的周期。 Docke…

閱讀更多...

PDF解決方案（2）--文件轉PDF

PDF解決方案（2）--文件轉PDF

相關專題鏈接： PDF解決方案（1）--文件上傳 PDF解決方案（2）--文件轉PDF PDF解決方案（3）--PDF轉SWF PDF解決方案（4）--在線瀏覽前言：上一篇中講到的文件上傳&…

閱讀更多...

Docker 常用命令(二)

Docker 常用命令(二)

Docker 鏡像常用命令搜索鏡像可使用 docker search 命令搜索存放在 Docker Hub 中的鏡像。例如： docker search java 執行該命令后， Docker 就會在 Docker Hub 中搜索含有 java 這個關鍵詞的鏡像倉庫。執行該命令后，可看到類似于如下的表格…

閱讀更多...

Docker 使用Dockerfile構建Docker(三)

Docker 使用Dockerfile構建Docker(三)

Dockerfile 簡單使用先來編寫一個最簡單的 Dockerfile。例如： FROM nginx RUN echo <h1>使用Dockerfile構建鏡像</h1> > /usr/share/nginx/html/index.html 該 Dockerfile 非常簡單，其中的 FORM 、 RUN 都是 Dockerfile 的指令。 FROM …

閱讀更多...

網絡流之最大流問題

網絡流之最大流問題

Reference： http://blog.csdn.net/rrerre/article/details/6751520 http://blog.csdn.net/y990041769/article/details/21026445 http://www.nocow.cn/index.php/Translate:USACO/NetworkFlow 最大流Edmonds_Karp算法模板： EK算法即增廣路算法。最大流最…

閱讀更多...

delphi讀取excel

delphi讀取excel

簡單的例子 1 procedure TForm1.Button1Click(Sender: TObject);2 var3 ExcelApp,MyWorkBook: OLEVariant;4 begin5 opendialog1.Filter:Microsoft Excel Workbook (*.xls)|*.XLS|; 6 edit2.Text : sheet1;7 if opendialog1.Execute then8 begin9 edit1.Text:o…

閱讀更多...

Docker-compose 常用命令及網絡設置(五)

Docker-compose 常用命令及網絡設置(五)

Docker Compose 常用命令 build 構建或重新構建服務。服務被構建后將會以 project_service的形式標記,例如:comoretest db。help 査看指定命令的幫助文檔,該命令非常實用。 docker-compose所有命令的幫助文檔都可通過該命令查看。 docker-compose he lp COMMAND 示例 docker-co…

閱讀更多...

淺談 trie樹及其實現

淺談 trie樹及其實現

定義：又稱字典樹，單詞查找樹或者前綴樹，是一種用于快速檢索的多叉樹結構， 如英文字母的字典樹是一個26叉樹，數字的字典樹是一個10叉樹。核心思想：是空間換時間.利用字符串的公共前綴來降低查詢時間的開銷以…

閱讀更多...

Docker-compose 安裝與基本使用(四)

Docker-compose 安裝與基本使用(四)

安裝 Docker-Compose Compose有多種安裝方式,例如通過 shell, pip以及將 Compose作為容器安裝等。本次安裝以Shell 為主。通過以下命令自動下載并安裝適應系統版本的 Compose: curl -L "https://github.com/docker/compose/releases/download/1.10.0/docker-compose-$(un…

閱讀更多...

如何開始DDD(完)

如何開始DDD(完)

連續寫了兩篇文章，這一篇我想是序的完結篇了。結合用戶注冊的例子再將他簡單豐富一下。在這里只添加一個簡單需求，就是用戶注冊成功后給用戶發一封郵件。補充一下之前的代碼 public class DomainService {public void Register(User user){if (_userRepo…

閱讀更多...

git pull 報錯：Untracked Fles Preventing Merge

git pull 報錯：Untracked Fles Preventing Merge

場景使用 git pull 命令更新報錯解決找到對應的文件刪除后重新打開項目。

閱讀更多...

關于string，我今天科普的

關于string，我今天科普的

今天下午朋友討論組上討論一個關于string的問題，問題是這樣的，string a"aaa";string ba;a"bbb",為什么測試b的值不改變？之前我看過一個文章，知道肯定不相等，因為引用地址的一系列問題，…

閱讀更多...

最新文章