Apache Hadoop文件上傳、下載、分布式計算案例初體驗

上篇:Apache Hadoop完全分布式集群搭建無坑指南-CSDN博客

通過上篇,我們搭建了完整的Hadoop集群,此篇我們簡單通過集群上傳和下載文件,同時測試分布式worldCount案例。后續的篇章再對分布式計算、分布式存儲作更深的理解。

上傳下載測試

從linux本地文件系統上傳下載文件驗證HDFS集群工作是否正常

#創建目錄
hdfs dfs -mkdir -p /test/input#本地hoome目錄創建一個文件,隨便寫點內容進去
cd /root
vim test.txt
?
#上傳linxu文件到Hdfs
hdfs dfs -put /root/test.txt /test/input
?
#從Hdfs下載文件到linux本地(可以換別的節點進行測試)
hdfs dfs -get /test/input/test.txt

分布式計算測試

在HDFS文件系統根目錄下面創建一個wcinput文件夾

[root@hadoop01 hadoop-2.9.2]# hdfs dfs -mkdir /wcinput

創建wc.txt文件,輸入如下內容

hadoop mapreduce yarn
hdfs hadoop mapreduce
mapreduce yarn kmning
kmning
kmning

上傳wc.txt到Hdfs目錄/wcinput下

hdfs dfs -put wc.txt /wcinput

執行mapreduce任務

hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.9.2.jar wordcount /wcinput/ /wcoutput

打印如下

24/07/03 20:44:26 INFO client.RMProxy: Connecting to ResourceManager at hadoop03/192.168.43.103:8032
24/07/03 20:44:28 INFO input.FileInputFormat: Total input files to process : 1
24/07/03 20:44:28 INFO mapreduce.JobSubmitter: number of splits:1
24/07/03 20:44:28 INFO Configuration.deprecation: yarn.resourcemanager.system-metrics-publisher.enabled is deprecated. Instead, use yarn.system-metrics-publisher.enabled
24/07/03 20:44:29 INFO mapreduce.JobSubmitter: Submitting tokens for job: job_1720006717389_0001
24/07/03 20:44:29 INFO impl.YarnClientImpl: Submitted application application_1720006717389_0001
24/07/03 20:44:29 INFO mapreduce.Job: The url to track the job: http://hadoop03:8088/proxy/application_1720006717389_0001/
24/07/03 20:44:29 INFO mapreduce.Job: Running job: job_1720006717389_0001
24/07/03 20:44:45 INFO mapreduce.Job: Job job_1720006717389_0001 running in uber mode : false
24/07/03 20:44:45 INFO mapreduce.Job:  map 0% reduce 0%
24/07/03 20:44:57 INFO mapreduce.Job:  map 100% reduce 0%
24/07/03 20:45:13 INFO mapreduce.Job:  map 100% reduce 100%
24/07/03 20:45:14 INFO mapreduce.Job: Job job_1720006717389_0001 completed successfully
24/07/03 20:45:14 INFO mapreduce.Job: Counters: 49File System CountersFILE: Number of bytes read=70FILE: Number of bytes written=396911FILE: Number of read operations=0FILE: Number of large read operations=0FILE: Number of write operations=0HDFS: Number of bytes read=180HDFS: Number of bytes written=44HDFS: Number of read operations=6HDFS: Number of large read operations=0HDFS: Number of write operations=2Job CountersLaunched map tasks=1Launched reduce tasks=1Data-local map tasks=1Total time spent by all maps in occupied slots (ms)=9440Total time spent by all reduces in occupied slots (ms)=11870Total time spent by all map tasks (ms)=9440Total time spent by all reduce tasks (ms)=11870Total vcore-milliseconds taken by all map tasks=9440Total vcore-milliseconds taken by all reduce tasks=11870Total megabyte-milliseconds taken by all map tasks=9666560Total megabyte-milliseconds taken by all reduce tasks=12154880Map-Reduce FrameworkMap input records=5Map output records=11Map output bytes=124Map output materialized bytes=70Input split bytes=100Combine input records=11Combine output records=5Reduce input groups=5Reduce shuffle bytes=70Reduce input records=5Reduce output records=5Spilled Records=10Shuffled Maps =1Failed Shuffles=0Merged Map outputs=1GC time elapsed (ms)=498CPU time spent (ms)=3050Physical memory (bytes) snapshot=374968320Virtual memory (bytes) snapshot=4262629376Total committed heap usage (bytes)=219676672Shuffle ErrorsBAD_ID=0CONNECTION=0IO_ERROR=0WRONG_LENGTH=0WRONG_MAP=0WRONG_REDUCE=0File Input Format CountersBytes Read=80File Output Format CountersBytes Written=44

查看結果

[root@hadoop01 hadoop-2.9.2]# hdfs dfs -cat /wcoutput/part-r-00000
hadoop  2
hdfs ?  1
kmning  3
mapreduce ? ? ? 3
yarn ?  2

可見,程序將單詞出現的次數通過MapReduce分布式計算統計了出來。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/43102.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/43102.shtml
英文地址,請注明出處:http://en.pswp.cn/web/43102.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

嘎嘎詳細的三維變換詳細講解,包括視圖變換、投影變換等,超級通俗易懂!

前置二維空間的各種變換筆記:二維變換 三維空間中的齊次坐標 從二維變換開始引申,可得到三維中的一個點的表達方式為 ( x , y , z , 1 ) ? (\mathbf{x}, \mathbf{y}, \mathbf{z}, 1)^{\top} (x,y,z,1)?,也就是w1,而三維的向量…

插入排序算法(C語言版)

直接插入排序 插入排序(insert sort)是一種簡單的排序算法,它的工作原理與手動整理一副牌的過程非常相似。 具體來說,我們在未排序區間選擇一個基準元素,將該元素與其左側已排序區間的元素逐一比較大小,并…

如何用 Python 繞過 cloudflare(5秒盾) 抓取數據:也不是很難嘛!

大家好!我是愛摸魚的小鴻,關注我,收看每期的編程干貨。 逆向是爬蟲工程師進階必備技能,當我們遇到一個問題時可能會有多種解決途徑,而如何做出最高效的抉擇又需要經驗的積累。本期文章將以實戰的方式,帶你全面了解 cloudflare(5秒盾) 以及如何繞過使用 cloudflare 服務…

(自用)gtest單元測試

gtest是Google的一套用于編寫C測試的框架,可以運行在很多平臺上(包括Linux、Mac OS X、Windows、Cygwin等等)。基于xUnit架構。支持很多好用的特性,包括自動識別測試、豐富的斷言、斷言自定義、死亡測試、非終止的失敗、生成XML報…

Mybatis的優缺點及適用場景?

目錄 一、什么是Mybatis? 二、Mybatis框架的特點 三、Mybatis框架的優點? 四、MyBatis 框架的缺點? 五、MyBatis 框架適用場合? 六、代碼示例 1. 配置文件 mybatis-config.xml 2. 映射文件 UserMapper.xml 3. Java 代碼…

QT TCP網絡通信編程

學習目標: TCP網絡通信編程 前置環境 運行環境:qt creator 4.12 學習內容 一、TCP 協議基礎知識: TCP 是一種面向連接的、可靠的、基于字節流的傳輸層通信協議。TCP 擁塞控制算法包括慢啟動、擁塞避免、快速重傳和快速恢復。TCP 通信需要建立連接,Qt 提供 QTcp…

linux 查看歷史命令列表來訪問之前的內容的命令是:history

在Linux中,要查看歷史命令列表以訪問之前的內容,你可以使用history命令。這個命令會顯示你當前shell會話(或者,如果你指定了參數,可能是所有會話)中執行過的命令列表。 基本用法 簡單地輸入history并按下…

設計模式使用場景實現示例及優缺點(結構型模式——代理模式、外觀模式)

結構型模式 代理模式(Proxy Pattern) 代理模式(Proxy Pattern)是一種結構型設計模式,它通過引入一個代理對象來控制對另一個對象的訪問。這個代理對象可以為被代理的對象提供額外的功能,例如訪問控制、延…

力扣844.比較含退格的字符串

力扣844.比較含退格的字符串 棧模擬 class Solution {public:bool backspaceCompare(string s, string t) {int n s.size(),m t.size();stack<char> s1,s2;for(int i0;i<n;i){s1.push(s[i]);if(s[i] #){if(s1.size() 1) s1.pop();else s1.pop(),s1.pop();}}for(i…

利用Python的sympy包求解一元多次方程

一元1次方程 import sympy as sp # 導入sympy包 x sp.Symbol(x) # 定義符號變量 f 2*x -8 # 定義要求解的一元1次方程 x sp.solve(f) # 調用solve函數求解方程 x[4]一元2次方程 import sympy as sp # 導入sympy包 x sp.Symbol(x) # 定義符號變量 f …

網絡安全合規建設

網絡安全合規建設 一、法律安全需求基本合規&#xff08;1&#xff09;《網絡安全法》重要節點等級保護政策核心變化 二、安全需求 業務剛需&#xff08;1&#xff09;內憂&#xff08;2&#xff09;外患 三、解決方法&#xff08;1&#xff09;總安全戰略目標圖&#xff08;2&…

廣匯汽車:救得起來嗎?

五折奔馳、六折寶馬...BBA們“腰斬式”大降價后正在引發連鎖反應。 國內第二大汽車經銷商——廣匯汽車&#xff0c;還好嗎&#xff1f; 受新能源品牌沖擊&#xff0c;近年來奔馳、寶馬等豪華燃油品牌銷量低迷&#xff0c;紛紛開啟降價模式&#xff0c;首當其沖的就是以廣匯汽車…

使用Python實現深度學習模型:跨平臺模型移植與部署

引言 隨著深度學習技術的快速發展,模型的跨平臺移植與部署變得越來越重要。無論是將模型從開發環境移植到生產環境,還是在不同的硬件平臺上運行,跨平臺部署都能顯著提高模型的實用性和可擴展性。本文將介紹如何使用Python實現深度學習模型的跨平臺移植與部署,并提供詳細的…

QT TCP多線程網絡通信

學習目標&#xff1a; TCP網絡通信編程 學習前置環境 運行環境:qt creator 4.12 QT TCP網絡通信編程-CSDN博客 Qt 線程 QThread類詳解-CSDN博客 學習內容 使用多線程技術實現服務端計數器 核心代碼 客戶端 客戶端&#xff1a;負責連接服務端&#xff0c;每次連接次數1。…

從零開始做題:MP3

題目 給出一個mp3文件 解題 右鍵->selection->save selection->另存為xxx.png即可 8750d5109208213f E:\逐鹿\MISC\tools\MP3Stego_1_1_19\MP3Stego>.\decode -X cipher.mp3 MP3StegoEncoder 1.1.19 See README file for copyright info Input file cipher.mp3…

未來代理IP的發展趨勢:創新、適應和可持續性

你是否好奇&#xff0c;未來代理IP將如何演變以適應日益復雜和全球化的網絡環境&#xff1f;讓我們探討一下代理IP技術在創新、適應性和可持續發展方面的未來前景。 1. 創新技術驅動 未來的代理IP將依托創新技術&#xff0c;如邊緣計算、區塊鏈和深度學習。邊緣計算技術的應用…

AcWing 5458:進水排水問題

【題目描述】 某已經蓄滿水的泳池內裝有 4 個水管。 前 2 個水管是進水管&#xff0c;單位時間的進水量分別為 a,b。 后 2 個水管是排水管&#xff0c;單位時間的排水量分別為 c,d。 請你計算&#xff0c;當 4 個水管同時工作時&#xff0c;是否可能將泳池里的水排干。【輸入格…

53-5 內網代理7 - CS上線不出網主機

靶場搭建: 這里就用之前內網代理的靶場,把web服務器這臺虛擬機關閉掉,用剩下的3臺加kali 各個虛擬機的網絡情況 kali - 可以連接外網win2008(之前的FTP服務器) 可以連接外網 win 7(之前的辦公電腦) 不出網主機 - 無法連接外網win2012 克隆機(之前的域控) - 無法連接…

視頻壓縮文件太大了怎么縮小?3個壓縮方法分享

視頻壓縮文件太大了怎么縮小&#xff1f;當視頻壓縮文件過大時&#xff0c;縮小其大小不僅能節省寶貴的存儲空間&#xff0c;還能顯著提升文件傳輸速度&#xff0c;特別是在網絡條件有限的情況下。通過專業的視頻壓縮軟件&#xff0c;可以有效減少文件體積&#xff0c;使視頻內…

python庫(9):prettytable庫快速實現ASCII表格

下面介紹一個快速制作ASCII表格庫——prettytable&#xff0c;可以方便地制作簡單表格。 1 安裝prettytable pip install -i https://pypi.tuna.tsinghua.edu.cn/simple prettytable 結果如下&#xff1a; 2 代碼實例 from prettytable import PrettyTable table PrettyTa…