成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Hadoop性能優化及配置如何實現?

開發 架構 Hadoop
在學習Hadoop的過程中,你可能會遇到Hadoop性能方面的問題,本文就向大家簡單介紹一下Hadoop性能優化及配置方面的內容,歡迎大家一起來學習。

本節向大家介紹一下Hadoop性能方面的內容,主要有Hadoop性能本地存放和Hadoop性能配置等內容,希望通過本節的學習大家對Hadoop性能有更深一步的了解。下面是關于Hadoop性能的具體介紹。

hadoop性能優化:hadoop機架感知實現及配置

背景

分布式的集群通常包含非常多的機器,由于受到機架槽位和交換機網口的限制,通常大型的分布式集群都會跨好幾個機架,由多個機架上的機器共同組成一個分布式集群。機架內的機器之間的網絡速度通常都會高于跨機架機器之間的網絡速度,并且機架之間機器的網絡通信通常受到上層交換機間網絡帶寬的限制。
具體到hadoop集群,由于hadoop的HDFS對數據文件的分布式存放是按照分塊block存儲,每個block會有多個副本(默認為3),并且為了數據的安全和高效,所以hadoop默認對3個副

hadoop性能本地存放策略為:

在本地機器的hdfs目錄下存儲一個block
在另外一個rack的某個datanode上存儲一個block
在該機器的同一個rack下的某臺機器上存儲最后一個block
這樣的策略可以保證對該block所屬文件的訪問能夠優先在本rack下找到,如果整個rack發生了異常,也可以在另外的rack上找到該block的副本。這樣足夠的高效,并且同時做到
hadoop性能了數據的容錯。但是,hadoop對機架的感知并非是自適應的,亦即,hadoop集群分辨某臺slave機器是屬于哪個rack并非是只能的感知的,而是需要hadoop的管理者人為的告知hadoop哪臺機器屬于哪個rack,這樣在hadoop的namenode啟動初始化時,會將這些機器與rack的對應信息保存在內存中,用來作為對接下來所有的HDFS的寫塊操作分配datanode列表時(比如3個
block對應三臺datanode)的選擇datanode策略,做到hadoopallocateblock的策略:盡量將三個副本分布到不同的rack。
接下來的問題就是:通過什么方式能夠告知hadoopnamenode哪些slaves機器屬于哪個rack?以下是配置步驟。

hadoop性能配置

默認情況下,hadoop的機架感知是沒有被啟用的。所以,在通常情況下,hadoop集群的HDFS在選機器的時候,是隨機選擇的,也就是說,很有可能在寫數據時,hadoop將第一塊數
據block1寫到了rack1上,然后隨機的選擇下將block2寫入到了rack2下,此時兩個rack之間產生了數據傳輸的流量,再接下來,在隨機的情況下,又將block3重新又寫回了rack1
,此時,兩個rack之間又產生了一次數據流量。在job處理的數據量非常的大,或者往hadoop推送的數據量非常大的時候,這種情況會造成rack之間的網絡流量成倍的上升,成為
性能的瓶頸,進而影響作業的性能以至于整個集群的服務。
要將hadoop機架感知的功能啟用,配置非常簡單,在namenode所在機器的hadoop-site.xml配置文件中配置一個選項:
topology.script.file.name
/path/to/script

這個配置選項的value指定為一個可執行程序,通常為一個腳本,該腳本接受一個參數,輸出一個值。接受的參數通常為某臺datanode機器的ip地址,而輸出的值通常為該ip地址
對應的datanode所在的rack,例如”/rack1”。Namenode啟動時,會判斷該配置選項是否為空,如果非空,則表示已經用機架感知的配置,此時namenode會根據配置尋找該腳本,
并在接收到每一個datanode的heartbeat時,將該datanode的ip地址作為參數傳給該腳本運行,并將得到的輸出作為該datanode所屬的機架,保存到內存的一個map中。
至于腳本的編寫,就需要將真實的網絡拓樸和機架信息了解清楚后,通過該腳本能夠將機器的ip地址正確的映射到相應的機架上去。本節關于Hadoop性能方面的內容沒有介紹完,請繼續關注下節介紹。

【編輯推薦】

  1. Hadoop集群與Hadoop性能優化
  2. Hadoop集群配置全程跟蹤報道
  3. 專家講解 Hadoop:HBASE松散數據存儲設計
  4. 兩種模式運行Hadoop分布式并行程序
  5. Hadoop命令手冊使用指南
責任編輯:佚名 來源: csdn.net
相關推薦

2010-06-07 09:14:55

Hadoop集群

2010-05-24 14:59:29

Hadoop集群

2019-08-02 11:28:45

HadoopYARN調度系統

2010-06-04 11:00:27

hadoop性能優化

2023-10-18 10:38:53

API

2020-10-16 10:40:39

前端性能可視化

2018-09-20 11:54:31

數據庫MySQL性能優化

2010-08-13 09:01:39

2020-10-16 09:00:12

前端開發技術

2021-11-18 10:05:35

Java優化QPS

2011-03-01 17:26:48

WLAN優化

2013-12-16 17:35:14

2014-04-04 10:16:51

Nginx配置Nginx性能優化

2025-02-25 12:00:00

Java線程開發

2024-03-12 09:47:10

Redis數據庫

2010-06-03 15:13:34

Hadoop Hdfs

2021-02-02 13:45:31

Vue代碼前端

2009-07-05 11:23:44

2023-10-25 22:23:35

Dubbo路由

2017-04-25 16:20:10

頁面優化滾動優化
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 亚洲男人网 | 91视频正在播放 | 久久久久国产一级毛片高清网站 | 国产精品久久久久久亚洲调教 | 日本韩国电影免费观看 | 国产精品久久久久久久久久久新郎 | 日本精品视频一区二区三区四区 | 亚洲第一天堂 | 永久看片 | 国产一级片久久久 | 97久久精品午夜一区二区 | 午夜综合 | 日韩精品免费一区二区在线观看 | 在线日韩中文字幕 | 国产精品美女www爽爽爽视频 | 9porny九色视频自拍 | 91精品国产综合久久久久久丝袜 | 成人在线视频观看 | 亚洲综合一区二区三区 | 久久久精 | 狠狠躁18三区二区一区 | 日韩影音 | 伦理二区| 国内久久精品 | 国产成人精品久久二区二区 | 免费中文字幕 | 欧美日韩黄色一级片 | 天天操操 | 欧美日韩精品 | 在线看免费的a | 成人在线视频一区 | 欧美三级电影在线播放 | 在线免费观看黄色 | 伊人色综合久久久天天蜜桃 | av在线成人 | 国产91一区二区三区 | 久久精品国产一区老色匹 | 在线观看国产视频 | 中文字幕日本一区二区 | 成人av鲁丝片一区二区小说 | 国产精品久久久久不卡 |