Yarn簡單介紹及內存配置

在這篇博客中,主要介紹了Yarn對MRv1的改進,以及Yarn簡單的內存配置和Yarn的資源抽象container。
我么知道MRv1存在的主要問題是:在運行時,JobTracker既負責資源管理又負責任務調度,這導致了它的擴展性、資源利用率低等問題。之所以存在這樣的問題,是與其最初的設計有關,如下圖:

從上圖可以看到,MRv1是圍繞著MapReduce進行,并沒有過多地考慮以后出現的其它數據處理方式 。按著上圖的設計思路,我們每開發一種數據處理方式(例如spark),都要重復實現相應的集群資源管理和數據處理。因此,Yarn就很自然的被開發出來了。
Yarn對MRv1的最大改進就是將資源管理與任務調度分離,使得各種數據處理方式能夠共享資源管理,如下圖所示:

從上圖我們可以看到,Yarn是一種統一資源管理方式,是從MRv1中的JobTracker分離出來的。這樣的好處顯而易見:資源共享,擴展性好等。
MRv1與Yarn的主要區別:在MRv1中,由JobTracker負責資源管理和作業控制,而Yarn中,JobTracker被分為兩部分:ResourceManager(RM)和ApplicationMaster(AM)。如下圖所示:

從上圖中,我們可以清晰的看到 ,對于MRv1無論是資源管理里還是任務調度都是有JobTracker來完成得。這導致了,JobTracker負荷太大不便于管理和擴展而對于Yarn,我們看可以清晰地看到資源管理和任務調度被分為了兩個部分:RM和AM。
Yarn與MRv1的差異對編程的影響:我們知道,MRv1主要由三部分組成:編程模型(API)、數據處理引擎(MapTask和ReduceTask)和運行環境(JobTracker和TaskTracker);Yarn繼承了MRv1的編程模型和數據處理,改變的只是運行環境,所以對編程沒有什么影響。
為了更好 的說明Yarn的資源管理,首先來看下Yarn的框架,如下圖所示:

從上圖可以看到 ,當客戶向RM提交 作業時,由AM負責向RM提出資源申請,和向NameManager(NM)提出task執行 。也就是說 在這個過程中,RM負責資源調度,AM 負責任務調度。幾點重要說明:RM負責整個集群的資源管理與調度;Nodemanager(NM)負責單個節點的資源管理與調度;NM定時的通過心跳的形式與RM進行通信,報告節點的健康狀態與內存使用情況;AM通過與RM交互獲取資源,然后然后通過與NM交互,啟動計算任務。
下面對上面的內容通過內存資源配置進行詳細說明:下面對上面的內容通過內存資源配置進行詳細說明:

RM的內存資源配置,主要是通過下面的兩個參數進行的(這兩個值是Yarn平臺特性,應在yarn-sit.xml中配置好):?
yarn.scheduler.minimum-allocation-mb?
yarn.scheduler.maximum-allocation-mb
說明:單個容器可申請的最小與最大內存,應用在運行申請內存時不能超過最大值,小于最小值則分配最小值,從這個角度看,最小值有點想操作系統中的頁。最小值還有另外一種用途,計算一個節點的最大container數目注:這兩個值一經設定不能動態改變(此處所說的動態改變是指應用運行時)。

NM的內存資源配置,主要是通過下面兩個參數進行的(這兩個值是Yarn平臺特性,應在yarn-sit.xml中配置) :
yarn.nodemanager.resource.memory-mb
yarn.nodemanager.vmem-pmem-ratio
說明:每個節點可用的最大內存,RM中的兩個值不應該超過此值。此數值可以用于計算container最大數目,即:用此值除以RM中的最小容器內存。虛擬內存率,是占task所用內存的百分比,默認值為2.1倍;注意:第一個參數是不可修改的,一旦設置,整個運行過程中不可動態修改,且該值的默認大小是8G,即使計算機內存不足8G也會按著8G內存來使用。

AM內存配置相關參數,此處以MapReduce為例進行說明(這兩個值是AM特性,應在mapred-site.xml中配置),如下:
mapreduce.map.memory.mb
mapreduce.reduce.memory.mb
說明:這兩個參數指定用于MapReduce的兩個任務(Map and Reduce task)的內存大小,其值應該在RM中的最大最小container之間。如果沒有配置則通過如下簡單公式獲得:
max(MIN_CONTAINER_SIZE, (Total Available RAM) / containers))
一般的reduce應該是map的2倍。注:這兩個值可以在應用啟動時通過參數改變;

AM中其它與內存相關的參數,還有JVM相關的參數,這些參數可以通過,如下選項配置:
mapreduce.map.java.opts
mapreduce.reduce.java.opts
說明:這兩個參主要是為需要運行JVM程序(java、scala等)準備的,通過這兩個設置可以向JVM中傳遞參數的,與內存有關的是,-Xmx,-Xms等選項。此數值大小,應該在AM中的map.mb和reduce.mb之間。

我們對上面的內容進行下總結,當配置Yarn內存的時候主要是配置如下三個方面:每個Map和Reduce可用物理內存限制;對于每個任務的JVM對大小的限制;虛擬內存的限制;

下面通過一個具體錯誤實例,進行內存相關說明,錯誤如下:
Container[pid=41884,containerID=container_1405950053048_0016_01_000284] is running beyond virtual memory limits. Current usage: 314.6 MB of 2.9 GB physical memory used; 8.7 GB of 6.2 GB virtual memory used. Killing container.
配置如下:

點擊(此處)折疊或打開

  1. <property>
  2. ????????<name>yarn.nodemanager.resource.memory-mb</name>
  3. ????????<value>100000</value>
  4. ????</property>
  5. ????<property>
  6. ????????<name>yarn.scheduler.maximum-allocation-mb</name>
  7. ????????<value>10000</value>
  8. ????</property>
  9. ????<property>
  10. ????????<name>yarn.scheduler.minimum-allocation-mb</name>
  11. ????????<value>3000</value>
  12. ????</property>
  13. ???<property>
  14. ????????<name>mapreduce.reduce.memory.mb</name>
  15. ????????<value>2000</value>
  16. ????</property>
通過配置我們看到,容器的最小內存和最大內存分別為:3000m和10000m,而reduce設置的默認值小于2000m,map沒有設置,所以兩個值均為3000m,也就是log中的“2.9 GB physical?
memory used”。而由于使用了默認虛擬內存率(也就是2.1倍),所以對于Map Task和Reduce Task總的虛擬內存為都為3000*2.1=6.2G。而應用的虛擬內存超過了這個數值,故報錯 。解決辦
法:在啟動Yarn是調節虛擬內存率或者應用運行時調節內存大小。

在上Yarn的框架管理中,無論是AM從RM申請資源,還是NM管理自己所在節點的資源,都是通過container進行的。Container是Yarn的資源抽象,此處的資源包括內存和cup等。下面對
container,進行比較詳細的介紹。為了是大家對container有個比較形象的認識,首先看下圖:


從上圖中我們可以看到,首先AM通過請求包ResourceRequest從RM申請資源,當獲取到資源后,AM對其進行封裝,封裝成ContainerLaunchContext對象,通過這個對象,AM與NM進行通訊,
以便啟動該任務。下面通過ResourceRequest、container和ContainerLaunchContext的protocol buffs定義,對其進行具體分析。

ResourceRequest結構如下:

點擊(此處)折疊或打開

  1. message ResourceRequestProto?{
  2. optional PriorityProto priority?=?1;?// 資源優先級
  3. optional?string?resource_name?=?2;?// 期望資源所在的host
  4. optional ResourceProto capability?=?3;?// 資源量(mem、cpu)
  5. optional int32 num_containers?=?4;?// 滿足條件container個數
  6. optional bool relax_locality?=?5?;?//default = true;?
  7. }
對上面結構進行簡要按序號說明:
2:在提交申請時,期望從哪臺主機上獲得,但最終還是AM與RM協商決定;
3:只包含兩種資源,即:內存和cpu,申請方式:
注:1、由于2與4并沒有限制資源申請量,則AP在資源申請上是無限的。2、Yarn采用覆蓋式資源申請方式,即:AM每次發出的資源請求會覆蓋掉之前在同一節點且優先級相同的資源請求,
也就是說同一節點中相同優先級的資源請求只能有一個。

container結構:

點擊(此處)折疊或打開

  1. message ContainerProto?{
  2. optional ContainerIdProto?id?=?1;?//container id
  3. optional NodeIdProto nodeId?=?2;?//container(資源)所在節點
  4. optional?string?node_http_address?=?3;
  5. optional ResourceProto resource?=?4;?//分配的container數量
  6. optional PriorityProto priority?=?5;?//container的優先級
  7. optional hadoop.common.TokenProto container_token?=?6;?//container token,用于安全認證
  8. }
注:每個container一般可以運行一個任務,當AM收到多個container時,將進一步分給某個人物。如:MapReduce

ContainerLaunchContext結構:

點擊(此處)折疊或打開

  1. message ContainerLaunchContextProto?{
  2. repeated StringLocalResourceMapProto localResources?=?1;?//該Container運行的程序所需的在資源,例如:jar包
  3. optional bytes tokens?=?2;//Security模式下的SecurityTokens
  4. repeated StringBytesMapProto service_data?=?3;
  5. repeated StringStringMapProto?environment?=?4;?//Container啟動所需的環境變量
  6. repeated?string?command?=?5;?//該Container所運行程序的命令,比如運行的為java程序,即$JAVA_HOME/bin/java org.ourclassrepeated ApplicationACLMapProto application_ACLs = 6;//該Container所屬的Application的訪問
  7. 控制列表
  8. }
下面結合一段代碼,僅以ContainerLaunchContext為例進行描述(本應該寫個簡單的有限狀態機的,便于大家理解,但時間不怎么充分):

點擊(此處)折疊或打開

  1. 申請一個新的ContainerLaunchContext:
  2. ContainerLaunchContext?ctx?=?Records.newRecord(ContainerLaunchContext.class);
  3. ??????????填寫必要的信息:
  4. ctx.setEnvironment(...);
  5. childRsrc.setResource(...);
  6. ctx.setLocalResources(...);
  7. ctx.setCommands(...);
  8. 啟動任務:
  9. startReq.setContainerLaunchContext(ctx);

最后對container進行如下總結:container是Yarn的資源抽象,封裝了節點上的一些資源,主要是CPU與內存;container是AM向NM申請的,其運行是由AM向資源所在NM發起的,并最終運行

的。有兩類container:一類是AM運行需要的container;另一類是AP為執行任務向RM申請的。



本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/539183.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/539183.shtml
英文地址,請注明出處:http://en.pswp.cn/news/539183.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

mysql計算時間函數_mysql時間計算函數

當前一個業務需求&#xff0c;需要查找創建在三天以前的數據&#xff0c;表中是存了一個創建時間的&#xff1b;這個需求看起來很簡單&#xff0c;直接全部查找出來然后用代碼根據時間篩選一下就可以了。但這只是適用于數據量不大的情況下&#xff0c;如果數據量大&#xff0c;…

html上傳文件_.NET基于WebUploader大文件分片上傳、斷網續傳、秒傳

(給DotNet加星標&#xff0c;提升.Net技能)轉自&#xff1a;學習中的苦與樂cnblogs.com/xiongze520/p/10412693.html現在的項目開發基本上都用到了上傳文件功能&#xff0c;或圖片&#xff0c;或文檔&#xff0c;或視頻。我們常用的常規上傳已經能夠滿足當前要求了&#xff0c;…

Hadoop運行任務時一直卡在: INFO mapreduce.Job: Running job

原文鏈接&#xff1a;http://blog.csdn.net/dai451954706/article/details/50464036 ----------------------------------------------------------------------------------------------------- 今天&#xff0c;一大清早同事就讓我幫他解決Hive的問題&#xff1a;他在Hive中…

git切換用戶密碼_Git 最基本的命令

本人比較懶&#xff0c;不是很愛學習新東西&#xff0c;之前用Git一直在用GUI SourceTree&#xff0c;今天因為用到Cloud IDEGitHub才迫不得已用一下Git的命令行&#xff0c;如果你是Git的新手&#xff0c;也分享給你最基本的命令。新建一個Git版本庫把一個本地文件夾變成一個G…

動態分區裝載數據

不開啟 一個個分區導入&#xff0c;分區需要做到一對一。 hive (zmgdb)> insert overwrite table p_t3 partition (cityningbo) > select name,post,address from p_t1 where cityningbo; 會啟動mapreduce進行導入&#xff0c;mr卡在kill job_xxxx&#…

python爬蟲常見報錯_對Python爬蟲常見工具總結,歡迎補充

前言 以前寫爬蟲都是用requests包&#xff0c;雖然很好用&#xff0c;不過還是要封裝一些header啊什么的&#xff0c;也沒有用過無頭瀏覽器&#xff0c;今天偶然接觸了一下。 原因是在處理一個錯誤的時候&#xff0c;用到了幾個以前沒有用過的工具&#xff1b;這幾個工具也挺常…

AI造福設計師:搭配色板這種苦差事交給GAN就好啦(教程)

本文來自AI新媒體量子位&#xff08;QbitAI&#xff09;設計師要開工&#xff0c;總是離不開配色方案&#xff0c;也就是色板。 不過&#xff0c;做色板可不是個簡單的活&#xff0c;色板生成器Colormind的作者Jack Qiao&#xff08;名字來自Product Hunt&#xff0c;我們下面叫…

mapreduce yarn內存參數

1、yarn-site.xml 設置 1.1 RM設置 RM的內存資源配置&#xff0c;主要是通過下面的兩個參數進行的&#xff08;這兩個值是Yarn平臺特性&#xff0c;應在yarn-sit.xml中配置好&#xff09;&#xff1a; yarn.scheduler.minimum-allocation-mb yarn.scheduler.maximum-allocati…

python有哪些常用的package_個人Python常用Package及其安裝

為了避免每次重裝系統時又要東翻西找&#xff0c;現在此記錄一下目前常用的Python包安裝過程。 1) Python: 2.7.11, 下載地址&#xff1a;www.python.org。由于個人喜歡使用PyQt4&#xff08;其實是不會PyQt5……&#xff09;&#xff0c;因此選擇安裝Python2.7。 安裝好Python…

html網頁設計大賽_HTML5網頁設計大賽 || 決賽名單公布

歷經數日的HTML5網頁設計大賽初賽已經落下的帷幕激動人心的決賽即將開始你們準備好了嗎&#xff1f;①決賽名單在經過評委老師多輪評選后,有以下隊伍/(個人)脫穎而出進入決賽&#xff1a;1.施佳鏞_故宮旅游網2.王永校_神秘莫測的宇宙3.黃煒岳_廣州旅游網站4.吳貴濱_NameLess5.陳…

2018.03.12、Android知識點-Java篇

1、闡述下對象的自動裝箱和拆箱 2 基本數據類型的自動裝箱(autoboxing)、拆箱(unboxing)是自J2SE 5.0開始提供的功能。自動裝箱是java編譯器在java原生類型和對應的對象包裝類型上做的自動轉換。 自動裝箱&#xff1a;Integer i 1&#xff1b;其實編譯器為你自動實現了&#x…

Hive的數據模型—桶表

概述 桶表是對數據進行哈希取值&#xff0c;然后放到不同文件中存儲。 數據加載到桶表時&#xff0c;會對字段取hash值&#xff0c;然后與桶的數量取模。把數據放到對應的文件中。 物理上&#xff0c;每個桶就是表(或分區&#xff09;目錄里的一個文件&#xff0c;一個作業產…

mysql+使用swap_MySQL避免使用SWAP

當物理內存的數量不能容納數據的時候&#xff0c;os會把虛擬內存中的數據寫到磁盤上&#xff0c;此時的交換對于運行在操作系統中的進程是透明的。交換對與MySQL性能有很大的影響&#xff0c;對于Innodb存儲引擎它對內存中的數據鎖住全局互斥量&#xff0c;如果此時導致了磁盤的…

delphi bmp繪制矢量文件效率慢_聊一聊矢量瓦片的常識

一、矢量瓦片的基本原理和相關格式現階段&#xff0c;電子地圖瓦片主要使用兩種方式&#xff0c;一種是傳統的柵格瓦片&#xff0c;另外一種是新出的矢量瓦片(Vector Tiles)&#xff0c;前者是采用四叉樹金字塔模型的分級方式&#xff0c;將地圖切割成無數大小相等的矩形柵格圖…

python生成器與迭代器。

生成器 在python 中一邊循環一邊計算的機制&#xff0c;叫做生成器(generator)。 通過列表生成式&#xff0c;我們可以直接創建一個列表。但是&#xff0c;收到內存的限制&#xff0c;列表容量肯定是有限的。而且&#xff0c;創建一個包含100萬個元素的列表&#xff0c;不僅占用…

centos mysql 設置_CentOS下MySQL安裝后配置和設置-阿里云開發者社區

CentOS下MySQL安裝后配置和設置&#xff1a;1&#xff1a;安裝完成路徑:1、數據庫目錄/var/lib/mysql/2、配置文件/usr/share/mysql(mysql.server命令及配置文件)3、啟動腳本/etc/rc.d/init.d/(啟動腳本文件mysql的目錄)4、相關命令/usr/bin(mysqladmin mysqldump等命令)注:1~3…

python怎樣將list轉化成字典_在python 中如何將 list 轉化成 dictionary

原標題&#xff1a;在python 中如何將 list 轉化成 dictionary 問題1&#xff1a;如何將一個list轉化成一個dictionary&#xff1f; 問題描述&#xff1a;比如在python中我有一個如下的list&#xff0c;其中奇數位置對應字典的key&#xff0c;偶數位置為相應的value解決方案: 1…

vscode gcc debug dbg gdb c cpp c++ cuckoo monitor

為什么80%的碼農都做不了架構師&#xff1f;>>> 裝cygwin 或者mingGW&#xff0c;裝gcc工具鏈&#xff0c;并將cygwin的bin目錄加入環境變量PATH中。 ctrlshiftb {// See https://go.microsoft.com/fwlink/?LinkId733558// for the documentation about the tasks…

hive索引

創建 hive (zmgdb)> create index index_t1 on table v_t1(name) > as > org.apache.hadoop.hive.ql.index.compact.CompactIndexHandler > with > deferred rebuild in table save_index_t1_table; OK Time …

python爬取知網論文關鍵詞_Python爬蟲根據關鍵詞爬取知網論文摘要并保存到數據庫中...

由于實驗室需要一些語料做研究&#xff0c;語料要求是知網上的論文摘要&#xff0c;但是目前最新版的知網爬起來有些麻煩&#xff0c;所以我利用的是知網的另外一個搜索接口 搜索出來的結果和知網上的結果幾乎一樣 在這個基礎上&#xff0c;我簡單看了些網頁的結構&#xff0c;…