如何在sheel中運行Spark

如何在sheel中運行Spark

bicheng/2025/9/16 11:36:27/文章來源:https://blog.csdn.net/2401_83374563/article/details/147752014

啟動hdfs集群，打開hadoop100:9870，在wcinput目錄下上傳一個包含很多個單詞的文本文件。

啟動之后在spark-shell中寫代碼。

// 讀取文件，得到RDD

????val rdd1 = sc.textFile("hdfs://hadoop100:8020/wcinput/words.txt")

????// 將單詞進行切割，得到一個存儲全部單詞的RDD

????val rdd2= fileRDD.flatMap(line => line.split(" "))

????// 將單詞轉換為元組對象，key是單詞，value是數字1

????val rdd3= wordsRDD.map(word => (word, 1))

????// 將元組的value按照key來分組，對所有的value執行聚合操作(相加)

????val rdd4= wordsWithOneRDD.reduceByKey((a, b) => a + b)

????// 收集RDD的數據并打印輸出結果

????rdd4.collect().foreach(println)

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/bicheng/80462.shtml
繁體地址，請注明出處：http://hk.pswp.cn/bicheng/80462.shtml
英文地址，請注明出處：http://en.pswp.cn/bicheng/80462.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

【入門】數字走向II

【入門】數字走向II

描述輸入整數N，輸出相應方陣。輸入描述一個整數N。（ 0 < n < 10 ) 輸出描述一個方陣，每個數字的場寬為3。 #include <bits/stdc.h> using namespace std; int main() {int n;cin>>n;for(int in;i>1;i--){for(…

閱讀更多...

Python自動化-python基礎(下)

Python自動化-python基礎(下)

六、帶參數的裝飾器七、函數生成器運行結果： 八、通過反射操作對象方法 1.添加和覆蓋對象方法 2.刪除對象方法通過使用內建函數: delattr() # 刪除 x.a() print("通過反射刪除之后") delattr(x, "a") x.a()3 通過反射判斷對象是否有指定…

閱讀更多...

重新定義高性能：Hyperlane —— Rust生態中的極速HTTP服務器

重新定義高性能：Hyperlane —— Rust生態中的極速HTTP服務器

重新定義高性能：Hyperlane —— Rust生態中的極速HTTP服務器 🚀 為什么選擇Hyperlane？ 在追求極致性能的Web服務開發領域，Hyperlane 憑借其獨特的Rust基因和架構設計，在最新基準測試中展現出令人驚艷的表現&#xff…

閱讀更多...

通俗的理解MFC消息機制

通俗的理解MFC消息機制

1. 消息是什么？ 想象你家的門鈴響了（比如有人按門鈴、敲門、或者有快遞），這些都是“消息”。在 MFC 中，消息就是系統或用戶觸發的各種事件，比如鼠標點擊（WM_LBUTTONDOWN）、鍵盤輸入…

閱讀更多...

騰訊開源SuperSonic：AI+BI如何重塑制造業數據分析？

騰訊開源SuperSonic：AI+BI如何重塑制造業數據分析？

目錄一、四款主流ChatBI產品二、ChatBI應用案例與實際落地情況三、SuperSonic底層原理 3.1、Headless?BI 是什么 3.2、S2SQL?是什么 3.3、SuperSonic 平臺架構四、ChatBI應用細節深挖五、與現有系統的集成方案六、部署和安全七、開源生態、可擴展性與二次開…

閱讀更多...

AI生成視頻推薦

AI生成視頻推薦

以下是一些好用的 AI 生成視頻工具： 國內工具可靈 ：支持文本生成視頻、圖片生成視頻，適用于廣告、電影剪輯和短視頻制作，能在 30 秒內生成 6 秒的高清視頻（1440p），目前處于免費測試階段。即…

閱讀更多...

OrangePi Zero 3學習筆記（Android篇）5 - usbutils編譯（更新lsusb)

OrangePi Zero 3學習筆記（Android篇）5 - usbutils編譯（更新lsusb)

目錄 1. Ubuntu中編譯 2. AOSP編譯 3. 去掉原來的配置 3. 打包 4. 驗證lsusb 在Ubuntu中，lsusb的源代碼源自usbutils。而OrangePi Zero 3中lsusb的位置可以看文件H618-Android12-Src/external/toybox/Android.bp， "toys/other/lsusb.c",…

閱讀更多...

bcm5482 phy 場景總結

bcm5482 phy 場景總結

1，BCM5482是一款雙端口10/100/1000BASE-T以太網PHY芯片，支持多種速率和雙工模式。其配置主要通過MDIO（Management Data Input/Output）接口進行，MDIO接口用于訪問PHY芯片內部的寄存器，從而配置網絡速率、雙工模式以及其他相關參數。 a,具體以下面兩種場景舉例 2. 寄存器和…

閱讀更多...

RedHat磁盤的添加和擴容

RedHat磁盤的添加和擴容

前情提要 🧱 磁盤結構流程概念圖： 物理磁盤 (/dev/sdX) └── 分區（如 /dev/sdX1）或整塊磁盤（直接使用） └── 物理卷 (PV, 用 pvcreate) └── 卷組 (VG, 用 vgcreate) …

閱讀更多...

Lua—元表（Metatable)

Lua—元表（Metatable)

原表解析在 Lua table 中我們可以訪問對應的 key 來得到 value 值，但是卻無法對兩個 table 進行操作(比如相加)。因此 Lua 提供了元表(Metatable)，允許我們改變 table 的行為，每個行為關聯了對應的元方法。 setmetatable(table,metatable…

閱讀更多...

一種運動平臺掃描雷達超分辨成像視場選擇方法——論文閱讀

一種運動平臺掃描雷達超分辨成像視場選擇方法——論文閱讀

一種運動平臺掃描雷達超分辨成像視場選擇方法 1. 專利的研究目標與意義1.1 研究目標1.2 實際意義2. 專利的創新方法與技術細節2.1 核心思路與流程2.1.1 方法流程圖2.2 關鍵公式與模型2.2.1 回波卷積模型2.2.2 最大后驗概率（MAP）估計2.2.3 統計約束模型2.2.4 迭代優化公式2.3 …

閱讀更多...

Listremove數據時報錯：Caused by: java.lang.UnsupportedOperationException

Listremove數據時報錯：Caused by: java.lang.UnsupportedOperationException

看了二哥的foreach陷阱后，自己也遇見了需要循環刪除元素的情況，立馬想到了當時自己陰差陽錯的避開所有坑的解決方式：先倒序遍歷，再刪除。之前好使，但是這次不好使了，報錯Caused by: java.lang.UnsupportedO…

閱讀更多...

Ceph集群OSD運維手冊：基礎操作與節點擴縮容實戰

Ceph集群OSD運維手冊：基礎操作與節點擴縮容實戰

#作者：stackofumbrella 文章目錄一、Ceph集群的OSD基礎操作查看osd的ID編號查看OSD的詳細信息查看OSD的狀態信息查看OSD的統計信息查看OSD在主機上的存儲信息查看OSD延遲的統計信息查看各個OSD使用率集群暫停接收數據集群取消暫停 OSD寫入權重操作查看默認OSD操作…

閱讀更多...

PHP框架在分布式系統中的應用！

PHP框架在分布式系統中的應用！

隨著互聯網業務的快速發展，分布式系統因其高可用性、可擴展性和容錯性成為現代應用架構的主流選擇。而PHP作為一門成熟的Web開發語言，憑借其簡潔的語法、豐富的框架生態和持續的性能優化，逐漸在分布式系統中嶄露頭角。本文將深入探討PHP框架在…

閱讀更多...

MySQL 索引（一）

MySQL 索引（一）

文章目錄索引（重點）硬件理解磁盤盤片和扇區定位扇區磁盤的隨機訪問和連續訪問軟件方面的理解建立共識索引的理解索引（重點） 索引可以提高數據庫的性能，它的價值，在于提高一個海量數據的檢索速度。案例…

閱讀更多...

環境搭建-復現ST-GCN輸出動作分類視頻（win10+openpose1.7.0+VS2019+CMake3.30.1+cuda11.1）

環境搭建-復現ST-GCN輸出動作分類視頻（win10+openpose1.7.0+VS2019+CMake3.30.1+cuda11.1）

這次我們安裝github.com/yysijie/st-gcn這個作者源碼環境，安裝流程十分復雜這里介紹大體流程。 1.首先編譯openpose的python API接口這個編譯難度較大，具體參考博文：windows編譯openpose及在python中調用_python openpose-CSDN博客這個博…

閱讀更多...

HTML屬性

HTML屬性

HTML（HyperText Markup Language）是網頁開發的基石，而屬性（Attribute）則是HTML元素的重要組成部分。它們為標簽提供附加信息，控制元素的行為、樣式或功能。本文將從基礎到進階，全面解析HTML屬性…

閱讀更多...

2025年“深圳杯”數學建模挑戰賽C題國獎大佬萬字思路助攻

2025年“深圳杯”數學建模挑戰賽C題國獎大佬萬字思路助攻

完整版1.5萬字論文思路和Python代碼下載：https://www.jdmm.cc/file/2712073/ 引言本題目旨在分析分布式能源 (Distributed Generation, DG) 接入配電網系統后帶來的風險。核心風險評估公式為： R P_{loss} \times C_{loss} P_{over} \times C_{over}…

閱讀更多...

兩數相加（2）

兩數相加（2）

2. 兩數相加 - 力扣（LeetCode） 解法： class Solution { public:ListNode* addTwoNumbers(ListNode* l1, ListNode* l2) {ListNode * dummy new ListNode(0);int carry 0;ListNode * head dummy;while (l1 ! nullptr || l2 ! nullptr ||…

閱讀更多...

基于大模型的新型隱球菌腦膜炎智能診療全流程系統設計與實現的技術方案文檔

基于大模型的新型隱球菌腦膜炎智能診療全流程系統設計與實現的技術方案文檔

目錄一、術前風險預測系統1. 多模態融合模型架構2. 風險預測流程圖（Mermaid）二、麻醉劑量預測系統1. 靶控輸注（TCI）模型2. 麻醉方案優化流程圖（Mermaid）三、術后并發癥預測模型1. 時序預測模型（LSTM）2. 并發癥預測流程圖（Mermaid）四、健康教育管理模塊1. 移動健康（…

閱讀更多...

最新文章