windows下eclipse遠程連接hadoop集群開發mapreduce

轉載請注明出處,謝謝
2017-10-22 17:14:09
之前都是用python開發maprduce程序的,今天試了在windows下通過eclipse java開發,在開發前先搭建開發環境。在此,總結這個過程,希望能夠幫助有需要的朋友。
用Hadoop eclipse plugin,可以瀏覽管理HDFS,自動創建MR程序的模板文件,最爽的就是可以直接Run on hadoop。
1、安裝插件
下載hadoop-eclipse-plugin-1.2.1.jar,并把它放到?F:\eclipse\plugins 目錄下。
2、插件配置與使用
2.1指定hadoop的源碼目錄
2.2、打開Map/Reduce視圖
”Window”->”Open Perspective”->”Other”->“Map/Reduce”.
“Window”->”Show views”->”Other”->”Map Reduce Tools”->”Map/Reduce locations”.

?

正常情況下回出現左上角的HDFS標志,等eclipse與hadoop集群連接后,會在這顯示HDFS目錄結構。
2.3、新建Map/Reduce Localtion
點擊圖中紅色框或者鼠標右擊選中新建,然后出現下面的界面,配置hadoop集群的信息。
這里需要注意的是hadoop集群信息的填寫。因為我是在windows下用eclipse遠程連接hadoop集群【完全分布式】開發的,所以這里填寫的host是master的IP地址。如果是hadoop偽分布式的可以填寫localhost。
【Jser name】填寫的windows電腦的用戶名,右擊【我的電腦】-->【管理】-->【本地用戶和組】-->【修改用戶名字】
完成前面的步驟后,正常的eclipse界面應該像下圖那樣的。注意example1工程是我自己新建的,主要是用來驗證eclipse能否遠程連接hadoop集群來開發mapreduce程序。并且,此時在eclipse的HDFS視圖界面對HDFS的操作(增刪查)和在命令行上對HDFS操作的結果是一樣的。
3、開發mapreduce程序
3.1、新建mapreduce工程
使用插件開發的好處這時顯示出來了,完成這一個步驟,在工程視圖會出現一個mapreduce工程模板,不用我們自己導入hadoop的jar包。下圖紅框就是新建mapreduce工程后生成的空模板,我們需要做的是在src文件夾中新建包和開發java程序。
3.3、在遠程終端中通過命令行方式上傳文件hadoop fs -put test.txt /input/? 或者 通過eclipse 的HDFS視圖上傳input文件: /input/test.txt,內容如下:
liang ni hao ma
wo hen hao
ha
qwe
asasa
xcxc vbv xxxx aaa eee
3.2、WordCount.java程序
package com.hadoop.example1;
import java.io.IOException;
import java.util.Iterator;
import java.util.StringTokenizer;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapred.FileInputFormat;
import org.apache.hadoop.mapred.FileOutputFormat;
import org.apache.hadoop.mapred.JobClient;
import org.apache.hadoop.mapred.JobConf;
import org.apache.hadoop.mapred.MapReduceBase;
import org.apache.hadoop.mapred.Mapper;
import org.apache.hadoop.mapred.OutputCollector;
import org.apache.hadoop.mapred.Reducer;
import org.apache.hadoop.mapred.Reporter;
import org.apache.hadoop.mapred.TextInputFormat;
import org.apache.hadoop.mapred.TextOutputFormat;
public class WordCount {public static class Map extends MapReduceBase implementsMapper<LongWritable, Text, Text, IntWritable> {private final static IntWritable one = new IntWritable(1);private Text word = new Text();public void map(LongWritable key, Text value,OutputCollector<Text, IntWritable> output, Reporter reporter)throws IOException {String line = value.toString();StringTokenizer tokenizer = new StringTokenizer(line);while (tokenizer.hasMoreTokens()) {word.set(tokenizer.nextToken());output.collect(word, one);}}}public static class Reduce extends MapReduceBase implementsReducer<Text, IntWritable, Text, IntWritable> {public void reduce(Text key, Iterator<IntWritable> values,OutputCollector<Text, IntWritable> output, Reporter reporter)throws IOException {int sum = 0;while (values.hasNext()) {sum += values.next().get();}output.collect(key, new IntWritable(sum));}}public static void main(String[] args) throws Exception {JobConf conf = new JobConf(WordCount.class);conf.setJobName("wordcount");conf.setOutputKeyClass(Text.class);conf.setOutputValueClass(IntWritable.class);conf.setMapperClass(Map.class);conf.setCombinerClass(Reduce.class);conf.setReducerClass(Reduce.class);conf.setInputFormat(TextInputFormat.class);conf.setOutputFormat(TextOutputFormat.class);FileInputFormat.setInputPaths(conf, new Path(args[0]));FileOutputFormat.setOutputPath(conf, new Path(args[1]));JobClient.runJob(conf);}
}

?

3.3、運行examplse1工程
注意的這種開發方式運行采用的是:run on haoop
運行方法:【右擊工程】-->【Run as】-->【run on hadoop】 。在這里如果跳出一個界面讓你選擇,證明現在工程選用的Java Applicaltion不對。這時可以這樣做:【右擊工程】-->【Run as】-->【run on configrations】。并填寫傳的參數是輸入文件路徑和輸出目錄路徑。

在Linux eclipse上開發,以上步驟都成功的話程序會正常運行。但是在windows eclipse 下開發會以下錯誤。因為在hadoop源碼中會檢查windows文件權限,因此,我們要修改hadoop源碼。
14/05/29 13:49:16 WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable
14/05/29 13:49:16 ERROR security.UserGroupInformation: PriviledgedActionException as:ISCAS cause:java.io.IOException: Failed to set permissions of path: \tmp\hadoop-ISCAS\mapred\staging\ISCAS1655603947\.staging to 0700
Exception in thread "main" java.io.IOException: Failed to set permissions of path: \tmp\hadoop-ISCAS\mapred\staging\ISCAS1655603947\.staging to 0700
at org.apache.hadoop.fs.FileUtil.checkReturnValue(FileUtil.java:691)
at org.apache.hadoop.fs.FileUtil.setPermission(FileUtil.java:664)
at org.apache.hadoop.fs.RawLocalFileSystem.setPermission(RawLocalFileSystem.java:514)
at org.apache.hadoop.fs.RawLocalFileSystem.mkdirs(RawLocalFileSystem.java:349)
at org.apache.hadoop.fs.FilterFileSystem.mkdirs(FilterFileSystem.java:193)
at org.apache.hadoop.mapreduce.JobSubmissionFiles.getStagingDir(JobSubmissionFiles.java:126)
at org.apache.hadoop.mapred.JobClient$2.run(JobClient.java:942)
at org.apache.hadoop.mapred.JobClient$2.run(JobClient.java:936)
at java.security.AccessController.doPrivileged(Native Method)
at javax.security.auth.Subject.doAs(Unknown Source)
at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1190)
at org.apache.hadoop.mapred.JobClient.submitJobInternal(JobClient.java:936)
at org.apache.hadoop.mapreduce.Job.submit(Job.java:550)
at org.apache.hadoop.mapreduce.Job.waitForCompletion(Job.java:580)
at org.apache.hadoop.examples.WordCount.main(WordCount.java:82)
3.4、修改hadoop源碼以支持windows下eclipse開發mapreduce程序。
出現問題的代碼位于 【hadoop-1.2.1\src\core\org\apache\hadoop\fs\FileUtil.java】。
修改方式如下,注釋掉對文件權限的判斷。
private static void checkReturnValue(boolean rv, File p,
FsPermission permission)
throws IOException
{/*** comment the following, disable this functionif (!rv){throw new IOException("Failed to set permissions of path: " + p +" to " +String.format("%04o", permission.toShort()));}*/
}
然后將修改好的文件重新編譯,并將.class文件打包到hadoop-core-1.2.1.jar中,并重新刷新工程。這里,為了方便大家,我提供已經修改后的jar文件包,如果需要可以點擊下載,并替換掉原有的hadoop-1.2.1中的jar包,位于hadoop-1.2.1根目錄。
再次3,3步驟的操作,這時運行成功了。
3.5查看結果
在HDFS視圖刷新后,可以看到生成output_wordcount文件夾,進入此目錄可以看見生成的part-00000,其結果為:

?

轉載于:https://www.cnblogs.com/liangjf/p/7710789.html

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/257222.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/257222.shtml
英文地址,請注明出處:http://en.pswp.cn/news/257222.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

縮放瀏覽器時 背景圖片固定

今天遇到一個很奇怪的問題&#xff0c;頁面做好后&#xff0c;當縮放瀏覽器的時候&#xff0c;背景圖片跟著移動&#xff0c;這就使本來做好的內容看起來像是錯位了一樣&#xff0c;跟背景對不上。 研究了一下發現&#xff0c;不需要fixed 之類的&#xff0c;只需要給body加個 …

醫學影像后處理服務器系統的特點,【CT影像系統工作站怎么用】CT影像系統工作站好不好_使用技巧-ZOL軟件百科...

為滿足醫療衛生領域廣大影像工作者、醫生和醫院管理工作者的需求&#xff0c;本單位應用當代計算機技術&#xff0c;影像處理技術以及網絡技術開發的 CT型醫學影像工作站&#xff0c;可與各種CT配接&#xff0c;不需對原機作任何改動。實現了數字化存儲和接口標準化以及網絡管理…

20145308劉昊陽 《Java程序設計》實驗五報告

20145308劉昊陽 《Java程序設計》實驗五 Java網絡編程及安全 實驗報告 實驗名稱 Java網絡編程及安全 實驗內容 1&#xff0e;掌握Socket程序的編寫&#xff1b; 2&#xff0e;掌握密碼技術的使用&#xff1b; 3&#xff0e;設計安全傳輸系統。 統計的PSP(Personal Software Pro…

FPL 2017最佳論文:如何對FPGA云發動DoS攻擊?

第27屆現場可編程邏輯與應用國際會議&#xff08;The International Conference on Field-Programmable Logic and Applications&#xff0c;FPL&#xff09;九月份在比利時根特召開。在FPL 2017上&#xff0c;一篇來自德國卡爾斯魯厄理工學院&#xff08;Karlsruhe Institute …

應用程序唯一性

程序啟動后&#xff0c;如果再次啟動程序&#xff0c;不會出現2個程序&#xff0c;或者實現如Notepad已打開一個文件&#xff0c;再打開另外一個文件&#xff0c;則追加在Notepad界面上。 使用codeproject上別人編寫的一個類&#xff0c;加在程序啟動時即可。 sinstance.h /* M…

php的GC機制

在php5.3版本之前, php變量的回收機制只是簡單的通過計數來處理(當refcount0時&#xff0c;會回收內存),但這樣會出現一個問題 $aarray("str"); $a[]&$a; unset($a); 執行unset之前,$a的refcount 為2,執行unset之后,$a的refcout為1,因為是1不等于0,不能被回收內存…

Spring 框架的JDBC模板技術

1. 概述 Spring 框架提供了很多持久層的模板類來簡化編程;Spring 框架提供的JDBC模板類: JdbcTemplate 類;Spring 框架提供的整合 Hibernate 框架的模板類: HibernateTemplate 類2. 環境搭建 2.1 創建數據庫表結構 CREATE TABLE t_account(id INT PRIMARY KEY AUTO_INCREMENT,…

BZOJ 1692: [Usaco2007 Dec]隊列變換( 貪心 )

數據 n < 30000 , 然后 O( n ) 的貪心也過了..... USACO 數據是有多弱啊 ( ps : BZOJ 1640 和此題一模一樣 , 雙倍經驗 ) --------------------------------------------------------------------------------------#include<cstdio>#include<cstring>#include…

數據說話,88000條數據繪制北京市地圖

偶獲得一批數據&#xff0c;本著好玩的態度繪制下來看看到底是什么鬼&#xff0c;繪制的結果如下&#xff1a; 呵呵&#xff0c;什么都不像。而且中間最重要的部分因數據量過大繪制的已經看不清楚了。于是乎&#xff0c;縮小繪制范圍&#xff0c;去除周圍沒有用的數據。重新繪制…

我的第一個python web開發框架(11)——工具函數包說明(二)

db_helper.py是數據庫操作包&#xff0c;主要有兩個函數&#xff0c;分別是read()數據庫讀操作函數和write()數據庫寫操作函數。這個包的代碼是從小戴同學分享的博文改造過來的。 1 #!/usr/bin/env python2 # codingutf-83 4 import psycopg25 from common import log_helper6 …

ASP.NET:在一般處理程序中通過 Session 保存驗證碼卻無法顯示圖片?

1 using System.Drawing;2 using System.Web;3 using System.Web.SessionState;4 5 /// <summary>6 /// CaptchaHandler 的摘要說明7 /// </summary>8 public class CaptchaHandler : IHttpHandler, IRequiresSessionState  //簡記&#xff1a;我需要Session9 { …

[LINK]用Python計算昨天、今天和明天的日期時間

用Python計算昨天、今天和明天的日期時間 轉載于:https://www.cnblogs.com/Athrun/p/5477651.html

Windows系統下oracle數據庫每天定時備份

第一步&#xff1a;建立備份腳本oraclebackup.bat 首先建立一個備份bat文件&#xff0c;在D盤下新建備份目錄oraclebackup&#xff0c;將oracle安裝目錄下的EXP.EXE復制到此目錄下&#xff0c;再新建一個文本文件oraclebackup.txt&#xff0c;內容如下&#xff1a; echo off ec…

面試題3:二維數組查找

1 bool Find(const int *matrix, int rows, int columns, int number)2 {3 int key;4 int indexRow;5 int indexCol;6 7 /*合法性檢查*/8 if((NULL matrix)||(rows < 0)||(columns <0))9 { 10 return false; 11 } 12 13 /*提升…

linux crontab 命令

#method 1 crontab -e crontab -u root -e #不同用戶自己的任務計劃 crontab -l#method 2 vim /etc/crontab# Example of job definition: # .---------------- minute (0 - 59) # | .------------- hour (0 - 23) # | | .---------- day of month (1 - 31) # | | | .--…

[譯] RNN 循環神經網絡系列 2:文本分類

原文地址&#xff1a;RECURRENT NEURAL NETWORKS (RNN) – PART 2: TEXT CLASSIFICATION原文作者&#xff1a;GokuMohandas譯文出自&#xff1a;掘金翻譯計劃本文永久鏈接&#xff1a;github.com/xitu/gold-m…譯者&#xff1a;Changkun Ou校對者&#xff1a;yanqiangmiffy, To…

[置頂] Android開發者官方網站文檔 - 國內踏得網鏡像

Mark 一下&#xff1a; 鏡像地址&#xff1a;http://wear.techbrood.com/index.html Android DevelopTools: http://www.androiddevtools.cn/ 轉載于:https://www.cnblogs.com/superle/p/4561856.html

Java實現選擇排序

選擇排序思想就是選出最小或最大的數與第一個數交換&#xff0c;然后在剩下的數列中重復完成該動作。 package Sort;import java.util.Arrays;public class SelectionSort {public static int selectMinKey(int[] list, int beginIdx) {int idx beginIdx;int temp list[begin…

ASP.NET MVC中ViewData、ViewBag和TempData

1.ViewData 1.1 ViewData繼承了IDictionary<string, object>,因此在設置ViewData屬性時,傳入key必須要字符串型別,value可以是任意類型。 1.2 ViewData它只會存在這次的HTTP要求而已,而不像Session可以將數據帶到下HTTP要求。 public class TestController : Controller{…

java 正則表達式驗證郵箱格式是否合規 以及 正則表達式元字符

package com.ykmimi.testtest; /*** 測試郵箱地址是否合規* author ukyor**/ public class EmailTest {public static void main(String[] args) {//定義要匹配的Email地址的正則表達式//其中\w代表可用作標識符的字符,不包括$. \w表示多個// \\.\\w表示點.后面有\w 括號{2,3}…