成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Hadoop YARN常見問題以及解決方案

開發 前端 Hadoop
本文匯總了幾個hadoop yarn中常見問題以及解決方案,注意,本文介紹解決方案適用于hadoop 2.2.0以及以上版本。

本文匯總了幾個hadoop yarn中常見問題以及解決方案,注意,本文介紹解決方案適用于hadoop 2.2.0以及以上版本。

(1) 默認情況下,各個節點的負載不均衡(任務數目不同),有的節點很多任務在跑,有的沒有任務,怎樣讓各個節點任務數目盡可能均衡呢?

答: 默認情況下,資源調度器處于批調度模式下,即一個心跳會盡可能多的分配任務,這樣,優先發送心跳過來的節點將會把任務領光(前提:任務數目遠小于集群可以同時運行的任務數量),為了避免該情況發生,可以按照以下說明配置參數:

如果采用的是fair scheduler,可在yarn-site.xml中,將參數yarn.scheduler.fair.max.assign設置為1(默認是-1,)

如果采用的是capacity scheduler(默認調度器),則不能配置,目前該調度器不帶負載均衡之類的功能。

當然,從hadoop集群利用率角度看,該問題不算問題,因為一般情況下,用戶任務數目要遠遠大于集群的并發處理能力的,也就是說,通常情況下,集群時刻處于忙碌狀態,沒有節點一直空閑著。

(2)某個節點上任務數目太多,資源利用率太高,怎么控制一個節點上的任務數目?

答:一個節點上運行的任務數目主要由兩個因素決定,一個是NodeManager可使用的資源總量,一個是單個任務的資源需求量,比如一個 NodeManager上可用資源為8 GB內存,8 cpu,單個任務資源需求量為1 GB內存,1cpu,則該節點最多運行8個任務。

NodeManager上可用資源是由管理員在配置文件yarn-site.xml中配置的,相關參數如下:

yarn.nodemanager.resource.memory-mb:總的可用物理內存量,默認是8096

yarn.nodemanager.resource.cpu-vcores:總的可用CPU數目,默認是8

對于MapReduce而言,每個作業的任務資源量可通過以下參數設置:

mapreduce.map.memory.mb:物理內存量,默認是1024

mapreduce.map.cpu.vcores:CPU數目,默認是1

注:以上這些配置屬性的詳細介紹可參考文章:Hadoop YARN配置參數剖析(1)—RM與NM相關參數

默認情況,各個調度器只會對內存資源進行調度,不會考慮CPU資源,你需要在調度器配置文件中進行相關設置,具體可參考文章:Hadoop YARN配置參數剖析(4)—Fair Scheduler相關參數Hadoop YARN配置參數剖析(5)—Capacity Scheduler相關參數

(3)如何設置單個任務占用的內存量和CPU數目?

答:對于MapReduce而言,每個作業的任務資源量可通過以下參數設置:

mapreduce.map.memory.mb:物理內存量,默認是1024

mapreduce.map.cpu.vcores:CPU數目,默認是1

需要注意的是,默認情況,各個調度器只會對內存資源進行調度,不會考慮CPU資源,你需要在調度器配置文件中進行相關設置。

(4) 用戶給任務設置的內存量為1000MB,為何最終分配的內存卻是1024MB?

答:為了易于管理資源和調度資源,Hadoop YARN內置了資源規整化算法,它規定了最小可申請資源量、***可申請資源量和資源規整化因子,如果應用程序申請的資源量小于最小可申請資源量,則 YARN會將其大小改為最小可申請量,也就是說,應用程序獲得資源不會小于自己申請的資源,但也不一定相等;如果應用程序申請的資源量大于***可申請資源 量,則會拋出異常,無法申請成功;規整化因子是用來規整化應用程序資源的,應用程序申請的資源如果不是該因子的整數倍,則將被修改為最小的整數倍對應的 值,公式為ceil(a/b)*b,其中a是應用程序申請的資源,b為規整化因子。

以上介紹的參數需在yarn-site.xml中設置,相關參數如下:

yarn.scheduler.minimum-allocation-mb:最小可申請內存量,默認是1024

yarn.scheduler.minimum-allocation-vcores:最小可申請CPU數,默認是1

yarn.scheduler.maximum-allocation-mb:***可申請內存量,默認是8096

yarn.scheduler.maximum-allocation-vcores:***可申請CPU數,默認是4

對于規整化因子,不同調度器不同,具體如下:

FIFO和Capacity Scheduler,規整化因子等于最小可申請資源量,不可單獨配置。

Fair Scheduler:規整化因子通過參數yarn.scheduler.increment-allocation-mb和yarn.scheduler.increment-allocation-vcores設置,默認是1024和1。

通過以上介紹可知,應用程序申請到資源量可能大于資源申請的資源量,比如YARN的最小可申請資源內存量為1024,規整因子是1024,如果一個應用程序申請1500內存,則會得到2048內存,如果規整因子是512,則得到1536內存。

(5)我們使用的是Fairscheduler,配置了多個隊列,當用戶提交一個作業,指定的隊列不存在時,Fair Scheduler會自動創建一個新隊列而不是報錯(比如報錯:隊列XXX不存在),如何避免這種情況發生?

答:在yarn-site.xml中設置yarn.scheduler.fair.allow-undeclared-pools,將它的值配置為false(默認是true)。

(6)使用Hadoop 2.0過程中,遇到了錯誤,怎樣排查錯誤?

答:從hadoop 日志入手,Hadoop日志存放位置可參考我這篇文章:Hadoop日志到底存在哪里?

  原文鏈接:http://dongxicheng.org/mapreduce-nextgen/hadoop-yarn-problems-vs-solutions/

責任編輯:陳四芳 來源: dongxicheng.org
相關推薦

2019-10-08 16:05:19

Redis數據庫系統

2010-08-31 16:09:04

DIV+CSS

2010-08-04 10:20:30

Flex組件開發

2023-04-12 11:32:33

網絡

2019-04-04 13:11:37

React內存泄露memory leak

2010-08-26 12:59:29

marginCSS

2024-07-08 08:45:41

2016-09-27 21:14:53

JavaURL

2011-07-26 16:05:19

Oracle數據庫服務器

2025-02-19 08:00:00

移動端移動設備移動開發

2024-05-09 15:00:38

Python編碼開發

2010-09-01 14:51:12

CSSIEFirefox

2021-08-20 15:49:13

電腦主板維修

2021-05-18 08:21:38

React HooksReact前端

2024-10-30 11:00:00

Python列表索引

2024-05-24 10:56:24

PythonURL代碼

2009-12-24 11:13:41

2025-01-09 15:28:30

2024-11-08 13:47:35

中文亂碼配置

2011-02-22 14:00:16

vsftpd
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 亚洲精品女优 | 欧美黄色网 | 日韩三级在线 | 国户精品久久久久久久久久久不卡 | 神马久久av | 人人看人人搞 | 国产目拍亚洲精品99久久精品 | 成人在线视频观看 | 国产精品久久精品 | 国产精品入口 | 黄色精品视频网站 | 久久精品欧美一区二区三区不卡 | 欧美日韩在线免费观看 | 91视频大全| 精品国产一区二区国模嫣然 | 国产成人免费视频网站视频社区 | 91久久国产综合久久 | 精品国产乱码久久久久久蜜臀 | 久久久久se | 日韩成人久久 | 欧美日韩在线免费 | 国产精品久久国产精品99 | 欧美日韩精品在线免费观看 | 色婷婷综合久久久中字幕精品久久 | 91久久久久久久 | 亚洲美乳中文字幕 | 国产一区二区三区久久久久久久久 | 亚洲精品久久久一区二区三区 | 精品一区二区三区四区视频 | 国产一区二区视频免费在线观看 | 亚洲性在线 | 亚洲成人精品一区二区 | 最新一级毛片 | 亚洲一区视频在线 | 欧美日韩不卡合集视频 | 中文字幕国产一区 | 一级黄在线观看 | 中文字幕乱码视频32 | 亚洲三区在线播放 | 午夜成人免费电影 | 一区二区三区在线免费观看视频 |