成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Hadoop虛擬化的性能對比和調優經驗

云計算 Hadoop
vSphere Big Data Extensions(BDE)為用戶在虛擬化環境中靈活的部署和管理Hadoop集群提供了有效的支持。除卻這些優勢,虛擬化是否會傷害Hadoop運行的性能呢?為此,我們在同等規模上做了虛擬化部署和物理部署的Hadoop集群的性能對比和優化,實驗表明虛擬化Hadoop集群可以很好地支持生產環境。

虛擬化為Hadoop注入了前所未有的活力,從IT生產管理的角度,表現為以下幾點:

·Hadoop和其他消耗不同類型資源的應用一起部署共享數據中心可以提高總體資源利用率;

·靈活的虛擬機操作使得用戶可以動態的根據數據中心資源創建、擴展自己的Hadoop集群,也可以縮小當前集群、釋放資源支持其他應用如果需要;

·通過與虛擬化架構提供的HA、FT集成,避免了傳統Hadoop集群中的單點失敗,再加之Hadoop本身的數據可靠性,為企業大數據應用提供了可靠保證。

基于這些原因,vSphere Big Data Extensions(BDE)為用戶在虛擬化環境中靈活的部署和管理Hadoop集群提供了有效的支持。除卻這些優勢,虛擬化是否會傷害Hadoop運行的性能呢?為此,我們在同等規模上做了虛擬化部署和物理部署的Hadoop集群的性能對比和優化,實驗表明虛擬化Hadoop集群可以很好地支持生產環境。

虛擬化環境和物理環境的性能對比

圖1顯示了性能調優試驗的部署樣式,一臺物理服務器上只部署一臺虛擬機,Tasktracker和Datanode一起跑在同一個節點中。因為每個虛擬節點可以使用全部的服務器資源,方便進行虛擬化和傳統物理環境部署的Hadoop做性能對比和分析。試驗結果在圖2中顯示,虛擬化Hadoop相對于物理環境的性能對比幾乎是持平的。

 

152109994.png

 

圖1:性能對比部署

 

154041173.png

 

圖2:Apache Hadoop 1.2物理部署和虛擬化部署的性能對比

圖3顯示了更推薦生產環境使用的部署拓撲,一臺物理服務器上部署多臺虛擬節點。如圖2所示,這種部署將增加資源利用率從而得到更高的性能。

 

154404490.png

 

圖3:多虛擬機的部署

同時,我們把這些實驗經驗內嵌到vSphere BDE部署的Hadoop集群系統配置當中,屏蔽了性能優化的復雜性。雖然不同的數據中心設置和集群配置可能帶來不同的表現,這里按照創建、配置、擴展Hadoop集群的順序跟大家分享一些通用的經驗:

Hadoop虛擬化的調優經驗:

(1)計劃初始規模:集群表現于跟數據中心基礎設施和配置密切相關,建議用戶在一開始對環境表現難以預測的時候,先建立小規模集群,比如5臺或者6臺服務器,部署Hadoop,然后運行標準Hadoop基準了解自己數據中心的特點。然后根據需要逐步添加服務器和存儲等資源。

(2)選擇服務器:CPU建議不要少于2 * Quad-core并且激活HT(Hyper-Threading);為每個計算內核配置至少4G內存,并且預留6%的內存為虛擬化的有效運行。Hadoop性能對I/O很敏感,建議每臺服務器配置多塊本地存儲而不建議配置少塊大容量的硬盤。考慮任務調度的代價,對于每個計算內核不建議配置超過2塊本地存儲。為高性能考慮,推薦使用10G網卡。考慮為主節點服務器(運行namenode、Jobtracker)配置雙電源以提高可靠性。

(3)虛擬化配置:本地存儲盡量避免配置成RAID,為每一個物理盤創建一個datastore虛擬化網絡配置時為了可靠性和網絡傳輸效率,隔離管理網絡和Hadoop集群網絡。如圖4所示:

 

154628452.png

 

圖4:虛擬化網絡配置

(4)系統設置:BDE將會自動配置根據實驗經驗取得的虛擬磁盤和操作系統參數,向用戶屏蔽性能優化的具體細節。建議對性能敏感的用戶替換默認模板采用CentOS6*,因為Linux 6.* 內核的THP(TransparentHuge Page)和EPT(Extended PageTables,Intel處理器)可以一起幫助虛擬化性能。

(5)Hadoop配置: BDE將會自動產生并配置hadoop配置文件(主要在map-site.xml,core-site.xml,和 hdfs-site.xml內),包括塊大小(blocksize),會話管理和日志功能。但是有一些相關于MapReduce任務的參數,包括mapred.reduce.parallel.copies,io.sort.mb,io.sort.factor,io.sort.record.percent,和tasktracker.http.thread,需要根據不同負載具體設置。

(5)擴展建議:如果用戶觀察集群中CPU的利用率經常超過80%,建議加入新的節點。另外單個存貯節點的容量不建議超過24TB,否則一旦節點失敗,數據備份拷貝容易造成數據擁塞。擴展可以按照小規模集群上運行性能基準經驗和資源使用情況進行。

如有任何問題,您可以發郵件至bigdata_apac@vmware.com。

關于vSphere Big Data Extensions:

VMware vSphere Big Data Extensions(簡稱BDE)基于vSphere平臺支持大數據和Hadoop作業。BDE以開源Serengeti項目為基礎,為企業級用戶提供一系列整合的管理工具,通過在vSphere上虛擬化Hadoop,幫助用戶在基礎設施上實現靈活、彈性、安全和快捷的大數據部署、運行和管理工作。了解更多關于VMware vSphere Big Data Extensions的信息,請參見http://www.vmware.com/hadoop。

作者簡介

 

[[89180]]

 

李欣慧

VMware軟件高級工程師

現擔任VMware大數據部門高級工程師,致力于大數據在云計算中心上的服務化和高效化,工作在分布式系統性能優化領域。李欣慧畢業于中科院計算所,后加入IBM實驗室-分布式計算部,主要工作在云計算和并行數據處理領域,為大規模數據中心提供最優監控和運維工業解決方案。有9項專利在美國和中國注冊,在國際知名會議、學術期刊上發表論文5篇。

原文鏈接:http://vbigdata.blog.51cto.com/7526470/1298757

責任編輯:王程程 來源: 51CTO專家博客
相關推薦

2018-05-09 08:35:59

2019-09-17 08:56:29

TomcatJVM性能

2023-11-27 00:46:39

裸機虛擬機

2011-03-10 14:40:54

LAMPMysql

2010-01-22 11:06:03

GNUkFreeBSDLinux

2017-07-21 08:55:13

TomcatJVM容器

2011-07-01 10:09:50

ASP.NET

2012-06-20 11:05:47

性能調優攻略

2021-03-04 08:39:21

SparkRDD調優

2024-10-07 08:40:56

Spring應用程序Java

2020-11-09 07:34:49

JVM性能監控

2023-04-03 10:25:00

數據庫性能調優

2022-01-10 09:33:59

Firefox 95Chrome 97 Linux

2011-05-04 13:53:08

jQuery

2022-12-05 17:01:20

MySQL數據庫Oracle

2011-11-14 10:28:23

2020-11-30 11:40:35

NginxLinux性能調優

2011-05-20 15:02:01

Oracle性能調優

2017-04-13 15:15:17

Netflix ZuuNginx性能

2011-03-10 14:40:50

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 激情欧美日韩一区二区 | www.色综合| xx视频在线观看 | 日韩一区二区三区精品 | 欧美一区二区三区在线观看 | 国产日韩精品在线 | 狠狠干网站| 日韩欧美一区二区三区免费观看 | 国产一区不卡 | 亚洲电影专区 | 亚洲精品美女视频 | 少妇特黄a一区二区三区88av | 欧美日韩一区在线 | 中文字幕一区在线观看视频 | 无码国模国产在线观看 | 国产精品福利在线 | 97天天干| 午夜羞羞 | 日日噜噜夜夜爽爽狠狠 | 国产视频2021| 日本精品一区二区三区视频 | 中文字幕二区三区 | 欧美日韩视频网站 | 天天弄天天操 | 欧美一级网站 | 久久久久亚洲精品 | 四虎影视免费观看 | 国产一级特黄aaa大片评分 | 欧美日产国产成人免费图片 | 久久大陆| 亚洲成人国产 | 国产精品久久99 | 日韩欧美亚洲 | 成人午夜精品 | 99久久精品视频免费 | 国产免费一区二区 | 国产精品视频免费看 | 懂色一区二区三区免费观看 | 国产精品久久久久久久免费大片 | 一区二区三区国产精品 | 黑人精品欧美一区二区蜜桃 |