Hadoop小知識點


hdfs命令行

上傳 ?hadoop fs -put 文件名 hdfs://主機名:9000/...

下載 ?hadoop fs -get hdfs://主機名:9000/... 文件名


/hadoop/share/hadoop/mapreduce 文件夾下有測試程序

提交MapReduce任務命令

#hadoop jar hadoop-mapreduce-examples-2.4.1.jar pi 5 5


hadoop fs -mkdir /wordcount

hadoop fs -mkdir /wordcount/imput

hadoop fs -put test.txt /wordcount/input

hadoop jar hadoop-mapreduce-examples-2.4.1.jar wordcount /wordcount/input /wordcount/output


hadoop fs -ls /wordcount/output

hadoop fs -cat /wordcount/output/part-r-00000


hadoop fs -appendToFile 源 目的 ? ?HDFS支持追加,不支持修改



元數據:

/test/a.log, 3, {blk_1, blk_2}, [{blk_1:[h0, h1, h2]},{blk_2:[h1, h2, h3]}]

文件名 ?副本數 ?分塊 ?塊的副本所在的結點


(1)客戶端上傳文件時,NN首先往edits log文件中記錄元數據操作日志;

(2)上傳完成后,NN在內存中寫入這次上傳操作的元數據信息;

(3)edits滿或時間到,將edits刷入fsimage中,此步操作由secondnamenode來完成(checkpoint操作)。



checkpoint配置

hdfs-site.xml

fs.checkpoint.period ? ?default=3600s

fs.checkpoint.size ? ?default=64M



datanode配置

dfs.block.size ? ?default=128M

dfs.replication ? ?default=3


Linux ?du -sh * ? ?查看目錄中文件大小

hadoop spark 等基于大數據的產品,在Linux下開發更方便



Eclipse導包

1、新建project;

2、Project-->Properties-->Java Build Path-->Libraries-->AddLibrary-->User Library-->User Libraries-->New-->Add External JARs


hadoop/share/hadoop/...

hdfs hadoop-hdfs-2.4.1.jar,依賴于

hdfs/lib/*

common hadoop-common-2.4.1.jar,依賴于

common/lib/*



RUN-->Run Configuration-->Arguments-->VM arguments

設置 -DHADOOP_USER_NAME=...


Ctrl+T查看繼承結構



MapReduce中自定義排序的實現:

依據key類中的compareTo方法排序map task產生的中間輸出結果。


自定義Partitioner:

自定義的Partitioner類將所需的key值放入同一個reduce進程中處理,每個reduce進程將產生一個輸出文件。

Reduce進程的個數可通過job.setNumReduceTasks(int i)設置,默認reduce進程為1個。


ruduce number >= partitioner ? ?OK ?多余將產生空文件結果

reduce number < partitioner ? ?ERROR

reduce number = 1 ? ?OK



block ?文件塊

split ?切片

map task的數量由切片的數量決定

io.sort.mb ?緩沖大小,默認100M

io.sort.spill.percent ?閾值,默認0.8

mapred.local.dir ?寫入磁盤位置

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/387185.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/387185.shtml
英文地址,請注明出處:http://en.pswp.cn/news/387185.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

copy 擴展名 包含子文件夾 文件 到某個 文件夾

比如我在d:\fff下面有很多子文件夾&#xff0c;子文件夾里還有子文件夾&#xff0c;里面有些文件夾里有.ppm.bz2的后綴的文件&#xff0c;需要把他們找出來復制到d:\fff2里面&#xff0c;應該怎么用批處理寫&#xff1f;最佳答案1234echo offfor /r d:\fff %%a in (*.ppm.bz2) …

在線視頻常見加密方式及安全性透析

信息化時代&#xff0c;多媒體的應用日漸成為人們生活中不可或缺的部分&#xff0c;無論是獲取最新資訊還是教育學習&#xff0c;視頻都是直觀高效的媒介之一。 基于互聯網的快速傳播&#xff0c;眾多培訓機構也逐漸將線下原創版權課程遷移到在線平臺中&#xff0c;一方面可以更…

分享一個前后端分離的web項目(vue+spring boot)

Github地址&#xff1a;https://github.com/smallsnail-wh 前端項目名為wh-web后端項目名為wh-server項目展示地址為我的github pages&#xff08;https://smallsnail-wh.github.io&#xff09;用戶名&#xff1a;admin&#xff0c;密碼admin&#xff08;第一次啟動會比較慢&am…

部署php項目到linux

服務器&#xff1a;39.106.26.67rootBayou2009 數據庫&#xff1a;rootbayou2009 項目文件夾路徑&#xff1a;/home/www/項目文件夾名稱&#xff1a;education.bayou-tech.cn 綁定域名&#xff1a;education.bayou-tech.cn 綁定域名&#xff1a; 用ftp把配置文件下班到windows修…

ionic最新安裝教程

公司最近開發webapp&#xff0c;研究了一下ionicangularjs開發。 安裝過程中碰到許多問題&#xff0c;發現網上有好多資料都已經過時&#xff0c;在這里把最新的流程記錄一下。 首先是安裝node.js&#xff0c;通過nodejs官網下載&#xff0c;沒什么問題。npm已經默認安裝&#…

ZooKeeper安裝配置

配置 1、在conf目錄下創建一個配置文件zoo.cfg tickTime2000 dataDir.../zookeeper/data dataLogDir.../zookeeper/dataLog clientPort2181 initLimit5 syncLimit2 server.1server1:2888:3888 server.2server2:2888:3888 server.3server3:2888:3888 ?tickTime&#…

1.1 算法編譯與調試

編程要保持簡單&#xff08;KISS, keep it simple and stupid&#xff09;。 算法競賽中的輸入輸出框架&#xff1a; 輸入數據保存在文件中&#xff0c;輸出數據也保存在文件中。 幾乎所有算法競賽的輸入數據和標準答案都是保存在文件中的。 使用文件最簡單的方法是使用輸入…

ionic2開發的仿外賣點餐系統(Ionic2+Angular2

github上的項目源碼 Run this Project&#xff08;運行該項目&#xff09; first&#xff08;首先&#xff09;: make sure your computer install ionic 確保你的電腦安裝了ionic2,不懂自行百度 second&#xff08;其次&#xff09;:$ ionic start wechat_restaurant tutorial…

Container Injection

Container的歷史&#xff1a; 2000 年的時候 FreeBSD 開發了一個類似于 chroot 的容器技術 Jails&#xff0c;這是最早期&#xff0c;也是功能最多的容器技術。Jails 英譯過來是監獄的意思&#xff0c;這個“監獄”&#xff08;用沙盒更為準確&#xff09;包含了文件系統、用戶…

HadoopHA集群搭建

三臺主機&#xff1a; 192.168.143.111 hdp1 192.168.143.112 hdp2 192.168.143.113 hdp3 1、安裝配置ZooKeeper&#xff1b; (1)在conf目錄下創建配置文件zoo.cfg tickTime2000 dataDir.../zookeeper/data dataLogDir.../zookeeper/dataLog clientPort2181 initLim…

node搭建服務器,寫接口,調接口,跨域

剛開始學node&#xff0c;今天做這個也是累死寶寶了&#xff0c;以后可以自己寫接口自己用了&#xff0c;再也不用麻煩人家后臺人員了&#xff0c;這些年我們欠他們的太多了&#xff0c;說多了都是淚&#xff0c;不多說&#xff0c;往下看吧。。。 服務端項目目錄下&#xff1a…

ThreadPoolExcutor 線程池 異常處理 (上篇)

前言 最近看到crossoverJie的一篇文章&#xff1a;一個線程罷工的詭異事件 首先感謝原作者的分享&#xff0c;自己獲益匪淺。然后是回想到自己的一次面試經歷&#xff0c;面試官提問了線程池中的線程出現了異常該怎樣捕獲&#xff1f;會導致什么樣的問題&#xff1f; 示例代碼 …

3 MapReduce計算模型

MapReduce被廣泛應用于日志分析、海量數據排序、在海量數據中查找特定模式等場景中。 MapReduceJob 在Hadoop中&#xff0c;每個MapReduce任務都被初始化為一個Job。 每個Job又可以分為兩個階段&#xff1a;Map階段和Reduce階段。這兩個階段分別用Map函數和Reduce函數來表示。…

ionic3 調用本地相冊并上傳圖片

前言在APP中啟動相冊選擇器或者拍照上傳圖片這些功能是非常常見的。對于Ionic2&#xff0c;我們只能通過cordova插件實現調用原生的功能。下面將簡單的封裝一個選擇相冊或拍照上傳圖片的ImgService服務。具體如下。 Cordova準備下載安裝所需的Cordovar插件&#xff1a; Image P…

Mapreduce中maptask過程詳解

一、Maptask并行度與決定機制 1.一個job任務的map階段的并行度默認是由該任務的大小決定的&#xff1b; 2.一個split切分分配一個maprask來并行處理&#xff1b; 3.默認情況下&#xff0c;split切分的大小等于blocksize大小&#xff1b; 4.切片不是mapper類中對單詞的切片&…

4 開發MapReduce應用程序

系統參數配置 Configuration類由源來設置&#xff0c;每個源包含以XML形式出現的一系列屬性/值對。如&#xff1a; configuration-default.xml configuration-site.xml Configuration conf new Configuration(); conf.addResource("configuraition-default.xml"…

實用的HTML5的上傳圖片方法

<input type"file" accept"video/*;capturecamcorder"> <input type"file" accept"audio/*;capturemicrophone"><input type"file" accept"image/*;capturecamera">直接調用相機<input type…

3.11 列出完數

完數&#xff1a;一個數恰好等于不包括自身的所有不同因子之和。如6123。 輸入&#xff1a;每一行含有一個整數n。 輸出&#xff1a;對每個整數n&#xff0c;輸出所有不大于n的完數。輸出格式為&#xff1a;整數n&#xff0c;冒號&#xff0c;空格&#xff0c;完數&#xff0…

angularjs 上傳

xxx.module.ts模塊 import { NgModule} from “angular/core”; import { FileUploadModule } from “ng2-file-upload” ; import { XXXComponent } from “./xxx.component”; NgModule({ imports:[ FileUploadModule ], declarations:[ XXXComponent &#xff0c;/component…

PHPCMS的產品篩選功能

如下圖所示功能&#xff1a; 首先&#xff0c;用下面這些代碼替換掉phpcms/libs/functions/extention.func.php的內容 <?php /*** extention.func.php 用戶自定義函數庫** copyright (C) 2005-2010 PHPCMS* license http://www.phpcms.cn/licen…