spark RDD iterator中sparkEnv功能 -- （視頻筆記）

spark RDD iterator中sparkEnv功能 -- （視頻筆記）

news/2025/6/30 23:33:21/文章來源:https://blog.csdn.net/weixin_30493401/article/details/98646272

sparkEnv是spark環境變量

1、可以從其中get 緩存

2、為master workder driver 管理和保存運行時對象。

3、excutorid ，excutor 一種為driver類型，一種具體處理task 內部有線程池的excutor

4、actorSystem ，如果運行在driver 則為spark driver，如果在excutor上在則為spark excutor

5、serializer 序列化器

6、cacheManager

7、mapOutputTracker，它負責保存shuffle map output輸出位置信息。

在一個stage中產出的數據通過shuffle write寫入到localFileSystem中，具體存儲在什么位置，就是由mapOutputTracker跟蹤記錄的。

master slave 模式，driver 上則為 mapOutputTrackerMaster，work上則為mapOutputTrackerWorker，worker匯總master獲取信息。

8、shuffleManager

hash

sort

可插拔，支持擴展

9、broadcastManager 廣播，

例如

join的時候，小的表就可以廣播到大的表所在的機器上。

也可以把全局信息廣播出去。

spark將任務廣播到具體的excutor；hadoop的MR，每次將配置信息登，每個任務都要重新加載。

10、BlockTransferService

讀取shuffle數據，有數據大小區別，不同的數據量使用不同的傳輸方式。Netty方式還是NIO的方式。

11、BlockManager

管理內存和磁盤等。。。管理storage模塊本身。

12、securityManager 安全模塊

13、HttpFileServer

提供http服務的server，用于excutor下載相關執行jar包的依賴。

14、metricsSystem

用于收集統計信息。

包括excutor的狀態，以及任務的狀態。

用于做監控工具很管用

15、shuffleMemoryManager

本身是用于管理shuffle執行過程中內存的。

申請和分配shuffle使用的內存，

假設N個線程，每個線程會申請到 1/(2N),最多可以申請到1/N的內存

N是動態變化，線程的數量會變化。

16、 sparkEnv是隨著sparkContext創建的。

?

轉載于:https://www.cnblogs.com/isenhome/p/5086494.html

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/news/256149.shtml
繁體地址，請注明出處：http://hk.pswp.cn/news/256149.shtml
英文地址，請注明出處：http://en.pswp.cn/news/256149.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

【圖像處理】——Python實現幾何變換（自定義+opencv庫）

【圖像處理】——Python實現幾何變換（自定義+opencv庫）

理論知識：參考https://blog.csdn.net/on2way/article/details/40460675 Python調用opencv函數參考：https://blog.csdn.net/on2way/article/details/46801063 一、引自《數字圖像處理》的基礎知識匯總這個很重要！！！這里需要注意的是反向映射和前向映射的區別，反…

閱讀更多...

Go語言學習資料整理

Go語言學習資料整理

整理網上找到的Golang語言學習資料基礎基礎教程書籍在線版Go 指南-A Tour of GoGo語言圣經（中文版）Effective Go中文版Go Web編程 build-web-application-with-golangGo入門指南 The Way to Go《The Way to Go》中文譯本，中文正式名《Go入門…

閱讀更多...

C++總結筆記（四）—— 堆棧區域劃分與引用實例解析

C++總結筆記（四）—— 堆棧區域劃分與引用實例解析

文章目錄前言😀一、概念1.1. 內存分區1.1.1 堆區1.1.2 棧區1.1.3 程序代碼區1.1.4 全局/靜態存儲區1.1.5 常量存儲區1.2. 引用二、程序示例總結前言😀 在C的內存管理中，堆區和棧區是一個非常重要的概念，理解堆棧的相關知識&#…

閱讀更多...

學習Android MediaPlayer

學習Android MediaPlayer

Android Media Playback 原文 The Android multimedia framework includes support for playing variety of common media types, so that you can easily integrate audio, video and images into your applications. You can play audio or video from media files stored in…

閱讀更多...

spark2.0.1 安裝配置

spark2.0.1 安裝配置

1. 官網下載 wget http://d3kbcqa49mib13.cloudfront.net/spark-2.0.1-bin-hadoop2.7.tgz 2. 解壓 tar -zxvf spark-2.0.1-bin-hadoop2.7.tgz ln -s spark-2.0.1-bin-hadoop2.7 spark2 3. 環境變量 vi /etc/profile #Spark 2.0.1export SPARK_HOME/usr/local/spark2export PATH…

閱讀更多...

Spring Cloud各組件超時

Spring Cloud各組件超時

Ribbon的超時全局設置： ribbon:ReadTimeout: 60000ConnectTimeout: 60000局部設置： service-id:ribbon:ReadTimeout: 1000ConnectTimeout: 1000其中，service-id 是Ribbon所使用的虛擬主機名，一般和Eureka Server上注冊的服務名稱…

閱讀更多...

【圖像處理】——遍歷圖像所有像素的方法（for 循環和np.where遍歷）應用在模板制作

【圖像處理】——遍歷圖像所有像素的方法（for 循環和np.where遍歷）應用在模板制作

目錄具體np.where的用法可以參見：其他遍歷圖像的所有像素的方法：模板制作流程 Python代碼

閱讀更多...

C++總結筆記（五）——構造函數和析構函數

C++總結筆記（五）——構造函數和析構函數

文章目錄前言一、基本概念1 構造函數2 析構函數二、示例1. 構造函數和析構函數的簡單使用2. 拷貝構造函數的調用3. 淺拷貝和深拷貝前言本文講述了構造函數和析構函數的概念以及對應的示例，以便加深理解。一、基本概念 1 構造函數構造函數用于初始化類的對象&a…

閱讀更多...

LINUX 更新

LINUX 更新

sudo apt-get dist-upgrade,更新所有的軟件轉載于:https://www.cnblogs.com/jackieron/p/5997805.html

閱讀更多...

python實戰===如何優雅的打飛機

python實戰===如何優雅的打飛機

這是一個打飛機的游戲，結構如下： 其中images中包含的素材為命名為alien.png 命名為ship.png 游戲效果運行是這樣的： 敵軍，也就是體型稍微大點的，在上方左右移動，并且有規律向下移動。我軍目標，…

閱讀更多...

【圖像處理】——上采樣、下采樣、在模板匹配中的金字塔加速策略

【圖像處理】——上采樣、下采樣、在模板匹配中的金字塔加速策略

目錄 1、下采樣 Python自帶函數自定義函數 Python實現下采樣 2、上采樣 Python自帶函數自定義函數<

閱讀更多...

C++總結筆記（六）——友元

C++總結筆記（六）——友元

文章目錄前言一、基本概念二、程序示例1.全局函數調用私有成員2. 外部類調用私有成員3. 外部類的成員函數調用私有成員總結前言一、基本概念友元是C中為了方便類外的類或者函數訪問類內私有成員而定義的一種特殊語法，用friend關鍵字進行修飾。二、程序示例友…

閱讀更多...

Java默認類型，類型轉換，常量與變量筆記

Java默認類型，類型轉換，常量與變量筆記

默認類型： 在java里整數默認是int類型，小數默認是double類型，單個字符默認是char類型，true、false自然默認的是boolean類型，字符串默認的是String類型。變量和常量類型轉換： 因為有默認類型，在…

閱讀更多...

【圖像處理】——Python實現灰度特征提取

【圖像處理】——Python實現灰度特征提取

目錄 1、灰度特征 2、Python代碼 1、灰度特征 2、Python代碼 import cv2 import numpy as npdef gray_features(img):hist = cv2.calcHist([img],[0],None,[256],[0,255])#得到全局直方圖統計數據

閱讀更多...

C++總結筆記（七）—— 運算符重載

C++總結筆記（七）—— 運算符重載

文章目錄一、概念二、程序示例1. 加減乘除重載2. 賦值運算符重載3. 遞增遞減運算符重載4. 關系運算符重載5. 左移運算符重載6. 函數調用運算符重載一、概念 C中運算符重載是為了實現對象之間進行各種運算的特定語法，在某些特定的場合起到重要的作用，新建…

閱讀更多...

asp.net 加載xml到menu

asp.net 加載xml到menu

XML File <?xml version"1.0" encoding"utf-8" ?> <Area iAreaID "0" cAreaName"城市"><Province iAreaID "1" cAreaName"北京市"/><Province iAreaID "2" cAreaName"上海…

閱讀更多...

前端lvs訪問多臺nginx代理服務時出現404錯誤的處理

前端lvs訪問多臺nginx代理服務時出現404錯誤的處理

前端lvs訪問多臺nginx代理服務時出現404錯誤的處理環境描述：app --> lvs --> nginx --> server app訪問頁面購買流量頁面(nginx服務器)代理到后端和服務器交互(多臺server)剛開始訪問沒有問題，流量變大為了避免出現問題，nginx配置了…

閱讀更多...

使用numpy出現DeprecationWarning: The normed argument is ignored when density is provided. 解決方法忽略警告的方法

使用numpy出現DeprecationWarning: The normed argument is ignored when density is provided. 解決方法忽略警告的方法

目錄 1、從根本上進行解決 2、直接利用warning模塊忽略警告 1、從根本上進行解決 “DeprecationWarning: The normed argument is ignored when density is provided. In future passing both will result in an error.” 這種一般是因為函數庫或者是一些包package版本更新而…

閱讀更多...

iptables四個表與五個鏈間的處理關系

iptables四個表與五個鏈間的處理關系

轉載自：http://www.linuxidc.com/Linux/2012-08/67505.htm netfilter/iptables IP 信息包過濾系統是一種功能強大的工具，可用于添加、編輯和除去規則，這些規則是在做信息包過濾決定時，防火墻所遵循和組成的規則。這些規則存儲在專…

閱讀更多...

C++總結筆記（八）—— 菱形繼承

C++總結筆記（八）—— 菱形繼承

文章目錄一、基本概念二、程序舉例1. 虛繼承2. 內在邏輯一、基本概念菱形繼承是指存在兩個子類繼承自同一個基類，同時有子類繼承這兩個子類。二、程序舉例 1. 虛繼承使用虛繼承可以解決菱形繼承資源浪費的問題，因為有兩個子類繼承基類&#xff0c…

閱讀更多...

最新文章