Windows 7 64位系統上搭建Hadoop偽分布式環境(很詳細)

在開始配置前,我們先了解Hadoop的三種運行模式。

Hadoop的三種運行模式

  • 獨立(或本地)模式:無需運行任何守護進程,所有程序都在同一個JVM上執行。在獨立模式下測試和調試MapReduce程序很方便,因此該模式在開發階段比較適合。
  • **偽分布式模式:**Hadoop守護進程運行在本地機器上,模擬一個小規模的集群。
  • **全分布式模式:**Hadoop守護進程運行在一個集群上。

下面我們進入正題,即如何在Windows 7上搭建Hadoop偽分布式環境。

  1. 安裝JDK,設置環境變量。
    首先,在控制面板上查看自己的操作系統是32位還是64位。
    然后,檢查自己的電腦上是否已經具備Java環境。步驟如下:
    1)Ctrl+R
    2)cmd
    3)輸入java -version,若正常顯示java版本,證明本機已安裝java環境,跳到步驟2.若顯示“不是內部或外部命令”,則需要安裝JDK,繼續步驟4)
    4) 安裝JDK,樓主用的是jdk-8u131-windows-x64.exe,因為不允許重復上傳CSDN資源,所以樓主無法提供給大家,可以自行下載。說明:只需安裝JDK,不需要安裝JRE。
    5)配置Java環境變量,配置路徑:計算機(右鍵)–屬性–高級系統設置—高級–環境變量。
    在系統變量處新建,變量名:JAVA_HOME;變量值:你安裝JDK的位置,樓主的是D:\Tools\jdk
    修改path:在原有的那串變量值后增加%JAVA_HOME%\bin;…
    6)測試Java環境
    在cmd窗口:
    測試Java環境:
    echo %JAVA_HOME%
    echo %path%
    path
    java -version
    javac -version
  2. 下載Hadoop 2.7.7,這個樓主傳了資源,誠信賺分,哈哈(https://download.csdn.net/download/u013159040/10620584)
    下載,解壓到某個文件夾,如D:\Tools\Hadoop
  3. 下載window util for hadoop。為了配合hadoop 2.7.7,樓主也上傳了資源(https://download.csdn.net/download/u013159040/10620589),下載后解壓到hadoop2.7.7的bin目錄下,直接覆蓋該目錄下的所有內容。請注意此util與具體的hadoop版本是有關的,如果選用不同的hadoop版本,需要找到正確的util。
  4. 添加Hadoop環境變量,參考Java的,新建HADOOP_HOME 變量名同樣是自己存放hadoop的位置,如D:\Tools\Hadoop\hadoop-2.7.7, 并添加path路徑:%HADOOP_HOME%\bin
  5. 創建nodename和datanode目錄,用來保存數據,如:
    d:\tools\hadoop\data\namenode
    d:\tools\hadoop\data\datanode

  6. 在D:\Tools\Hadoop\hadoop-2.7.7\etc\hadoop里修改4個配置文件:core-site.xml, hdfs-site.xml, mapred-site.xml, yarn-site.xml

<configuration><property><name>fs.defaultFS</name><value>hdfs://localhost:9000</value></property>   
</configuration>

hdfs-site.xml(不要直接復制樓主的,要看看自己的namenode和datanode存放的位置是否和樓主一致,不一致的要修改):

<configuration><property><name>dfs.replication</name><value>1</value></property><property><name>dfs.namenode.name.dir</name><value>/D:/Tools/data/namenode</value></property><property><name>dfs.datanode.data.dir</name><value>/D:/Tools/data/datanode</value></property>
</configuration>

mapred-site.xml:

<configuration><property><name>mapreduce.framework.name</name><value>yarn</value></property>
</configuration>

yarn-site.xml:

<configuration><!-- Site specific YARN configuration properties --><property><name>yarn.nodemanager.aux-services</name><value>mapreduce_shuffle</value></property><property><name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name><value>org.apache.hadoop.mapred.ShuffleHandler</value></property><property><name>yarn.scheduler.minimum-allocation-mb</name><value>1024</value></property><property><name>yarn.nodemanager.resource.memory-mb</name><value>4096</value></property><property><name>yarn.nodemanager.resource.cpu-vcores</name><value>2</value></property>
</configuration>

7.上面步驟完成設置后,就可以試著運行Hadoop了。
Hadoop 啟動命令start -all.cmd
Hadoop 結束命令stop -all.cmd
進入到自己的hadoop sbin目錄(一直cd就行了),啟動start-all.cmd,再jps查看java進程,如下圖
這里寫圖片描述
同時,會跳出4個窗口
DataNode
namenode
nodemanager
resourcemanager

web方式查看文件系統:http://localhost:50070/
查看mapreduce job:http://localhost:8088
由NameNode(守護進程)服務提供


下面可以測試Hadoop自帶的Wordcount

  1. 在d盤新建一個txt文件t1.txt
    t1.txt
  2. 把t1上傳到HDFS: hadoop fs -put d:\t1.txt /t1/t1.txt
  3. cd進到mapreduce,然后可以開始運行wordcount了:
    hadoop jar /D:\Application\hadoop-2.7.7\share\hadoop\mapreduce\hadoop-mapreduce-examples-2.7.7.jar wordcount \t1 \output
    這里寫圖片描述
  4. 然后我們可以看到詞頻統計結果:
    這里寫圖片描述
    網頁上查看的如下:
    這里寫圖片描述
    可以下載分布式文件系統上的這個t1.txt文件。

——————————————–歡迎一起學習探討————————————————

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/385985.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/385985.shtml
英文地址,請注明出處:http://en.pswp.cn/news/385985.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

7年老Android一次操蛋的面試經歷,講的太透徹了

由于涉及到的面試題較多導致篇幅較長&#xff0c;我根據這些面試題所涉及到的常問范圍總結了并做出了一份學習進階路線圖???????及面試題答案免費分享給大家&#xff0c;文末有免費領取方式&#xff01; View面試專題 View的滑動方式View的事件分發機制View的加載流程…

處理效應模型stata實例_stata︱政策處理效應模型sata基本命令匯總

本文來源經管之家論壇,由壇友cuifengbao歸納 Use ,文件名.dta,clear Ssc installpamatch2,replace 一、首先做一元回歸 reg 結果變量 處理變量,r 二、直接引入協變量,再做多元回歸 reg 結果變量 處理變量 協變量1 協變量2 協變量3……,r 三、接下來進行傾向得分匹配 1.將數…

80后程序員月薪30K+感慨中年危機,面試必問!

說說程序猿行業 現在社會上給IT行業貼上了幾個標簽&#xff1a;高薪、高危、高大上、禿頂&#xff08;哈哈&#xff09;。這些標簽我相比大家都比較清楚&#xff0c;至于為什么是這些標簽呢&#xff1f;而且這些標簽是真實還是假象呢&#xff1f; 高薪 作為IT行業來說&#…

華為照片在哪個文件夾_原來華為手機還能這樣清理垃圾,怪不得你的手機可以多用5年...

對于目前市場上的智能手機來說&#xff0c;大家的手機功能都是差不多的&#xff0c;除了一些外觀上的差別之外&#xff0c;最大的區別就是手機的內存&#xff0c;但是很多朋友卻表示手機內存很大&#xff0c;但是沒用多久&#xff0c;手機就會出現卡頓或者是運行速度變慢的現象…

996頁阿里Android面試真題解析火爆全網,全網首發!

在安卓系統中&#xff1a; 當系統內存不足時&#xff0c;Android系統將根據進程的優先級選擇殺死一 些不太重要的進程&#xff0c;優先級低的先殺死。進程優先級從高到低如下。 前臺進程 處于正在與用戶交互的activity與前臺activity綁定的service調用了startForeground&…

python不適合大型項目_在大型項目上,Python 是個爛語言嗎? |

【洪強寧的回答(89票)】:太多硬傷和臆想&#xff0c;懶得批。只說“代碼超過 10w 以后你就別想用 python 開發了”這一句&#xff0c;2012年4月豆瓣主站項目代碼行數就近50萬行了&#xff0c;可我們還在用 python 開發。【劉鑫的回答(42票)】:我寫過幾年Python&#xff0c;也寫…

996頁阿里Android面試真題解析火爆全網,分享面經!

導語 學歷永遠是橫在我們進人大廠的一道門檻&#xff0c;好像無論怎么努力&#xff0c;總能被那些985,211 按在地上摩擦&#xff01; 不僅要被“他們”看不起&#xff0c;在HR挑選簡歷&#xff0c;學歷這塊就直接被刷下去了&#xff0c;連證明自己的機會也沒有&#xff0c;學…

access ole 對象 最大長度_Redis 數據結構和對象系統,有這 12 張圖就夠了!

作者 | 程序員歷小冰責編 | 林瑟Redis 是一個開源的 key-value 存儲系統&#xff0c;它使用六種底層數據結構構建了包含字符串對象、列表對象、哈希對象、集合對象和有序集合對象的對象系統。 今天我們就通過 12 張圖來全面了解一下它的數據結構和對象系統的實現原理。01數據結…

python煙花表白_python炫酷煙花表白源代碼

詳細內容天天敲代碼的朋友&#xff0c;有沒有想過代碼也可以變得很酷炫又浪漫&#xff1f;今天就教大家用Python模擬出綻放的煙花&#xff0c;工作之余也可以隨時讓程序為自己放一場煙花秀。python炫酷煙花表白源代碼這個有趣的小項目并不復雜&#xff0c;只需一點可視化技巧&a…

【面試總結】2021Java春招面試經歷

三、堆空間 基本描述 JVM啟動時創建堆區&#xff0c;是內存管理的核心區&#xff0c;通常情況下也是最大的內存空間&#xff0c;是被所有線程共享的&#xff0c;幾乎所有的對象實例都要在堆中分配內存&#xff0c;所以這里也是垃圾回收的重點空間。 堆棧關系 棧是JVM運行時的…

tableau地圖城市數據_Tableau 地圖 | 無法識別的城市

Tableau自帶的地圖功能很強大&#xff0c;也很簡單只要雙擊具有地理位置角色的字段&#xff0c;即可生成地圖不過有的時候在你部署地圖的時候總會發現有些城市或地名無法識別&#xff0c;提示如下&#xff1a;這篇post就來簡單聊聊為啥今天直說處理方法&#xff0c;不談后臺原理…

【高級Java架構師系統學習】最新Java高級面試題匯

性能調優 影響MySQLServer 性能的相關因素 商業需求對性能的影響系統架構及實現對性能的影響Query語句對系統性能的影響Schema設計對系統的性能影響硬件環境對系統性能的影響 MySQL 數據庫鎖定機制 MySQL鎖定機制簡介各種鎖定機制分析合理利用鎖機制優化MySQL MySQL數據庫Qu…

vue 安裝指定版本swiper_Vue中的runtime-only和runtime-compiler

在我們使用vue-cli的時候&#xff0c;會提示你安裝的版本可以看到有兩種版本&#xff1a;Routime Only和Runtime Compiler版本1.Runtime Only - 代碼中不可以有任何template 性能更高在該版本下&#xff0c;通常需要借助如webpack的vue-loader發工具把.vue文件編譯成js因為是在…

一文搞懂JVM架構:入職3個月的Java程序員面臨轉正

Java基礎 1.JAVA 中的幾種數據類型是什么&#xff0c;各自占用多少字節。 2.String 類能被繼承嗎&#xff0c;為什么。 3. 兩個對象的 hashCode() 相同&#xff0c;則 equals() 也一定為 true&#xff0c;對嗎&#xff1f; 4. String 屬于基礎的數據類型嗎&#xff1f; 5.…

不顯示調用super_讓不懂編程的人愛上iPhone開發(2017秋iOS11+Swift4+Xcode9版)-第11篇

歡迎回到我們的iPhone開發教程系列&#xff0c;讓我們繼續前進吧。重新來過別害怕&#xff0c;哥不是讓你拋棄之前所有的源代碼&#xff0c;從零開始重新構建這個項目&#xff01;這里說的是游戲界面里面的“Start over”按鈕。在我們的to-do清單里面曾經提到過&#xff0c;這個…

一文搞懂JVM架構:跳槽面試大廠被拒

正文 在實際的工作項目中&#xff0c; 緩存成為高并發、高性能架構的關鍵組件 &#xff0c;那么Redis為什么可以作為緩存使用呢&#xff1f;首先可以作為緩存的兩個主要特征&#xff1a; 在分層系統中處于內存/CPU具有訪問性能良好&#xff0c;緩存數據飽和&#xff0c;有良好…

全局變量_Python函數中的全局變量與局部變量

# a,b變量是全局變量,在整個py文件中都可以訪問a 11b 12# 定義一個函數def first():# 這個變量是函數內部定義的變量,屬于局部變量,只能在函數中使用c "Hello"# 大括號{} 是format()函數的用法,格式化print("c {}".format(c))# 如果局部變量定義的名稱…

一文詳解:字節面試官必問的Mysql鎖機制

一面 1 自我介紹和項目 2 Java的內存分區 3 Java對象的回收方式&#xff0c;回收算法。 4 CMS和G1了解么&#xff0c;CMS解決什么問題&#xff0c;說一下回收的過程。 5 CMS回收停頓了幾次&#xff0c;為什么要停頓兩次。 6 Java棧什么時候會發生內存溢出&#xff0c;Jav…

install npm 到某個文件下執行_你可能不知道的 npm 依賴管理那些事

點擊上方藍字關注我們npm 是 Node.js 默認的、以 JavaScript 編寫的包管理工具&#xff0c;如今&#xff0c;它已經成為世界上最大的包管理工具&#xff0c;是每個前端開發者必備的工具。不知你是否遇到過下面問題&#xff1a;哎&#xff1f;我本地明明是好的&#xff0c;線上的…

萬字總結!騰訊、字節跳動面經已發

二、常見的并發問題 1、臟讀 一個事務讀取了另一個事務未提交的數據 2、不可重復讀 一個事務對同一數據的讀取結果前后不一致。兩次讀取中間被其他事務修改了 3、幻讀 幻讀是指事務讀取某個范圍的數據時&#xff0c;因為其他事務的操作導致前后兩次讀取的結果不一致。幻讀…