Spark 寬依賴和窄依賴

2019獨角獸企業重金招聘Python工程師標準>>> hot3.png

我們知道RDD就是一個不可變的帶分區的記錄集合,Spark提供了RDD上的兩類操作,轉換和動作。轉換是用來定義一個新的RDD,包括map, flatMap, filter, union, sample, join, groupByKey, cogroup, ReduceByKey, cros, sortByKey, mapValues等,動作是返回一個結果,包括collect, reduce, count, save, lookupKey。

首先要注意一點,就是分區,那么:

  1. 如果一個RDD的依賴的每個分區只依賴另一個RDD的同一個分區,就是narow,如圖上的C和D,D和F,B和G,這樣就不需要進行shuffle,同時還可以按照流水線的方式,把一個分區上的多個操作放在一個Task里進行,如圖上覆蓋C,D,F的紅色陰影。
  2. 如果一個RDD的每個分區需要依賴另一個RDD的所有分區,就是wide,如圖上的A和B,F和G,這樣的依賴需要進行shuffle,需要更多的運算。



作者:用心閣
鏈接:https://www.zhihu.com/question/37137360/answer/70608128
來源:知乎
著作權歸作者所有,轉載請聯系作者獲得授權。

轉載于:https://my.oschina.net/dongtianxi/blog/733869

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/458050.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/458050.shtml
英文地址,請注明出處:http://en.pswp.cn/news/458050.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

smart gesture安裝失敗_WinCC flexible SMART V3 SP2安裝步驟以及常見錯誤解決方法

1安裝配置1. win7和win10系統都可以裝2. 運行內存至少要2G。3. 硬盤儲存空間至少要3G。2安裝注意事項1.安裝本軟件之前必須要關閉所有殺毒軟件(例如360安全衛士/360殺毒/電腦管家)等。2.其它西門子軟件不要使用或者打開。3.安裝之前確保硬盤空間充足。3下載地址https://bbs.jcp…

各類數據集整理(持續更新中ing)

轉自:https://zhuanlan.zhihu.com/p/84088095 最近一次新增:2020.02.11 大家好,先給各位抱拳了!我是和鯨(科賽 http://kesci.com)的運營一枚,今天給大家分享以下我們(通過網線&…

Java Experiment 3 PairProgramming

http://www.cnblogs.com/20145106ssr/p/5428222.html 轉載于:https://www.cnblogs.com/Christen/p/5428655.html

啟動頁面和各設備的寬高比及像素

2019獨角獸企業重金招聘Python工程師標準>>> iOS7只能用LaunchImage來布置啟動畫面,只能用圖片。iOS8以后支持LaunchScreen.xib來布置,可以自己添加控件。iOS8以及以后的用LaunchScreen來配置啟動頁。iOS8以后的會走這個設置,而io…

cc壓力測試_中小型網站如何防范CC攻擊?

大公司就不說了,付費CDN,防火墻,WAF,大流量,一般也會配置專門的安全問題響應團隊。今天側重討論一下中小型網站如何(優雅)防范CC攻擊。中小站點安全問題通病:對安全問題不重視&#…

ubuntu16.04 360隨身WiFi2

查看kernel版本,插入360隨身WiFi2,打開終端,執行下面命令即可。 ------------------------------------------------------------------------------------------------------------- From your kernel version, 4.2.0-16, it appears that…

泛型復習

回顧泛型類 泛型類&#xff1a;具有一個或多個泛型變量的類被稱之為泛型類1、class A<T>{} 2、在創建泛型實例時&#xff0c;需要為其類型變量賦值A<String> anew A<String>(); *如果創建實例時&#xff0c;不給類型變量賦值&#xff0c;那么會有一個警告&am…

.net core EPPlus npoi_2020 ASP.NET界面開發:DevExpress v20.1支持.NET Core設計時

DevExpress ASP.NET Web Forms Controls擁有針對Web表單(包括報表)的110種UI控件&#xff0c;DevExpress ASP.NET MVC Extensions是服務器端MVC擴展或客戶端控件&#xff0c;由輕量級JavaScript小部件提供支持的70個高性能DevExpress ASP.NET Core Controls&#xff0c;包含功能…

ubuntu android studio SDK emulator directory is missing

ctrlH&#xff0c;搜索Android studio&#xff0c;把所有的都刪除&#xff0c;再次安裝即可下載

有關于我的一點想法

之前失眠寫的&#xff0c;從空間搬運過來 之前一直想寫一下有關自己想法。趁著失眠寫一寫。 不知道是不是幸運&#xff0c;我有幸認識了吳寶俊老師。他寫博客&#xff0c;我經常去看他寫的博客。后來在留言板發言幾次也就熟了。雖然也僅限網友吧……但是我需要人給我指點迷津。…

mac電腦如何與手機同步復制粘貼_如何將電腦里的文件同步到手機里?

由于PDF的特殊性&#xff0c;一般很少有適用于手機編輯的軟件&#xff0c;所以我們都習慣于使用電腦來修改PDF文檔后&#xff0c;再發送到手機微信發送給其他人&#xff0c;那么如何快速將電腦里的PDF文件同步到手機里面呢&#xff1f;可能很多人會想到使用各種云盤&#xff0c…

走進緩存的世界(一) - 開篇

系列文章 走進緩存的世界&#xff08;一&#xff09; - 開篇走進緩存的世界&#xff08;二&#xff09; - 緩存設計走進緩存的世界&#xff08;三&#xff09; - Memcache概述 對于程序員來說多多少少都懂一點算法&#xff0c;算法是什么&#xff1f;算法是“時間”與“空間”的…

【解決問題】OpenCV(3.4.1) Error: Parsing error (xx.yaml(13): Incorrect indentation) in icvYMLParseValue

本博客運行環境為Ubuntu18.04 下 Kdevelop。 運行slam的一個cpp文件時&#xff0c;錯誤描述如下&#xff1a; OpenCV(3.4.1) Error: Parsing error (KITTI00-02.yaml(13): Incorrect indentation) in icvYMLParseValue, file /home/hadoop/opencv-3.4.1/modules/corec/persis…

dede后臺欄目管理文章統計數量和實際文章數不一致解決辦法

操作dede_arctiny表&#xff0c;將和欄目對應的typeid所有文章去掉即可。轉載于:https://www.cnblogs.com/zgzy/p/5432724.html

an 轉換器_400V耐壓場效應管替代IRF730B型號參數,使用在DC-DC電源轉換器。_場效應管吧...

DC-DC電源轉化器的應用場景逐漸廣泛&#xff0c;那么適用于DC-DC電源模塊的場效應管需求也隨之越來越高&#xff0c;這時候電源轉化器廠的電子工程師就要留意了&#xff0c;國內是否有優質的場效應管能替代IRF730B型號呢&#xff0c;其實是有的&#xff0c;FHP840其實是可以跟I…

spring MVC中頁面添加錨點

2019獨角獸企業重金招聘Python工程師標準>>> 需要添加錨點的代碼&#xff1a; <li><a href"main/index#page1">推薦車型</a></li> <li><a href"main/index#page2">熱門車型</a></li>需要跳轉的…

steam一鍵授權工具_半個東的時間讓你省了一個億 Steam免費游戲一鍵領取

總所周知Steam上有很多的免費游戲&#xff0c;但是有哪些游戲是免費的呢&#xff1f;這個一時半會兒也總結不出來&#xff0c;而且還得需要大量的時間添加到自己的游戲庫&#xff0c;今天這個教程就教大家如何一鍵添加Steam上大量免費游戲&#xff0c;需要的小伙伴趕緊收藏哦。…

YModem協議

源&#xff1a;YModem協議 YModem協議&#xff1a; YModem協議是由XModem協議演變而來的&#xff0c;每包數據可以達到1024字節&#xff0c;是一個非常高效的文件傳輸協議。 下面先看下YModem協議傳輸的完整的握手過程&#xff1a;先看下圖 SENDER:發送方。 RECEIVER:接收方。 …

gcc、clang、make、cmake、makefile、CMakeLists.txt概念學習

說明 編譯器是翻譯代碼為計算機語言的一個工具&#xff0c;我們平時寫的代碼如果想在某個特定的計算機上執行&#xff08;計算機的cpu構架不同&#xff09;&#xff0c;就需要編譯器來對代碼進行編譯匯編鏈接&#xff0c;而匯編和鏈接的過程對于每個不同的平臺上過程都不一樣。…

視覺在無人駕駛中的應用及分類_機器視覺在智能化生產中的廣泛應用

什么是機器視覺&#xff1f;顧名思義&#xff0c;簡單來說&#xff0c;機器視覺就是用機器代替人眼來測量和判斷。機器視覺系統是指通過機器視覺產品將被攝取目標轉換成圖像信號&#xff0c;傳送給專用的圖像處理系統&#xff0c;根據像素分布和亮度、顏色等信息&#xff0c;轉…