成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Hadoop架構中的HDFS和NameNode

運維 系統運維 Hadoop
到目前為止,我們談到Hadoop是一個創建分布式集群的框架,能夠處理大的、不同的數據集。然而,另一個說法是將Hadoop理解為一個存儲設備或存儲環境。確實,它是一個能夠在其上創建應用的平臺,有存儲PB級數據的能力。此外,它能夠處理并分析數據;提供越來越多的“大數據”應用結果。

到目前為止,我們談到Hadoop是一個創建分布式集群的框架,能夠處理大的、不同的數據集。然而,另一個說法是將Hadoop理解為一個存儲設備或存儲環境。確實,它是一個能夠在其上創建應用的平臺,有存儲PB級數據的能力。此外,它能夠處理并分析數據;提供越來越多的“大數據”應用結果。(不可否認,這正是一個以存儲為中心的Hadoop架構觀點。)

我們也可以說每個節點提供其本地計算并把資源存儲到集群,這些節點基于常用的服務器硬件。有時候用“cheap and deep”這一術語來描述資源配置理念,意思是集群由常用服務器(廉價的)組成,能夠擴展到數百個節點(深入)――都是以免費的Apache Hadoop(可以免費獲得)為基礎。

Hadoop:與RAID類似嗎?

鑒于cheap and deep(廉價和深入)的傾向,隨著時間的推移出現預期的一類或另一類組件失敗。所以Hadoop的目的是檢測并解決故障。這方面Hadoop有點類似于初期以廉價磁盤冗余陣列為代表的RAID。假設,由許多PC級磁盤構成存儲陣列,驅動器將來很可能發生故障。訣竅是允許驅動器出現故障而不丟失數據。不同的RAID級別(0,1,3,5,6等等)提供多種陣列配置和驅動器故障恢復模式。

的確,Hadoop可以看作廉價服務器冗余陣列(RAIS). Hadoop也假設冗余服務器的硬件故障將是一個正常的操作事件,并因此內置恢復進程。大多數部署在Hadoop分布式文件系統(HDFS)中.例如,當提取數據時,它被分解成數據塊(默認是64MB塊)。塊被多次拷貝然后分布――原始和副本――訪問DataNodes。HDFS默認創建兩份副本,并且通常寫入到不同機架的服務器。這個拷貝和分布進程由NameNode管理。如果由于某種原因一個DataNode服務器出現故障,包括內部磁盤故障,這個NameNode將在集群中其它地方找到丟失的數據,當故障節點被重啟或替換后進程能夠繼續執行。

區別于現代RAID陣列

盡管如此,還有一些明顯的遺漏。從DataNode的故障中恢復比NameNode中斷恢復相對容易。在當前的Apache Hadoop版本中,沒有適用于無功能的NameNode的自動恢復規定。Hadoop NameNode是一個臭名昭著的單點故障點(SPOF)——和RAID陣列沒有什么不同,單控制器的RAID陣列也是一個SPOF。NameNode損壞關閉集群可能導致數據丟失,如果故障發生,數據不能被恢復。此外,重啟大集群(假設數據可恢復)中的NameNode可能花費數小時。

Apache Hadoop尋址問題

缺乏自動NameNode故障轉移模式和其它Apache Hadoop的缺點(JobTracker是另一個SPOF)給商業供應商急于出售“企業就緒”方案提供了機會。這些供應商的普遍做法之一是從本質上支持Apache Hadoop,通過APIs訪問核心Hadoop組件,像HDFS一樣隨同他們自身修改,一些開放的和其它的專利。供應商列表分成以下幾類(但不限于此):

• EMC

• HortonWorks

• IBM

• MapR (也是由EMC Greenplum提供)

• Red Hat

這些供應商(其它供應商希望在解決問題的同時,保留Hadoop的MapReduce框架)的業務首先是為了解決NameNode和JobTracker SPOF問題。例如,MapR是Apache Hadoop工具的分布,實現集群中跨服務器分布式NameNode功能(分布式NameNode負載均衡)。Red Hat的GlusterFS使用它內置的元數據感知NameNode,完全消除了元數據服務器。

我們也提到,Hadoop創建多個跨集群分布的數據副本,適用于不同的恢復場景。然而,使用快照替代可能適用于回滾集群到一個已知的好的狀態,同時降低全數據拷貝的開銷。一些供應商在他們的Hadoop架構中支持快照拷貝。

回顧我們關于向外擴展的網絡直連存儲(NAS)作為Hadoop主存儲的討論, EMC Isilon也可以用來解決這些問題。Isilon的OneFS全局命名空間文件系統能夠支持Greenplum Hadoop (HD)集群。Isilon把HDFS看作“過線”協議,因此是第一個集成到HDFS的SoNAS平臺。它也解決了Hadoop NameNode 和 JobTracker功能的單點故障。

Apache Hadoop的回應

公平地說,我們不得不指出Apache社區清楚Hadoop當前NameNode和其它問題的缺陷。事實上,現在從Cloudera (CDH 4.0)可以得到一個重要的作為測試版的新版本,專門針對NameNode SPOF問題。它包括一個HDFS的高可用(HA)版本.在HA版本中是一個“熱備”NameNode,在管理員控制下,當活動節點出現故障或因管理員在日常維護和升級將NameNode離線時接管——通常這種情況很有可能。總之,HDFS HA包括兩個主/備配置的NameNodes。將來,支持自動NameNode故障切換。

結語

我們由關注大數據存儲開始本系列,另一種說法是PB級存儲,大數據分析是做商業智能(BI)的新途徑。但是,我們已經看到大數據存儲如何與Hadoop結合使用——集成大數據存儲和分析——Hadoop可以被看作一個PB級存儲設備。

然而,我們還沒有真正探索一個最終的但重要的因素:成本。除了我們以前描述的給無共享集群增加網絡存儲的潛在問題,一個存儲區域網絡(SAN)和NAS也被“傳統主義者”視為太昂貴的方法。記住這個準則:cheap and deep。與之相似,在集群結點級固態硬盤(SSD)作為直連存儲(DAS)的替代方案。甚至能夠用渦輪給集群增壓的存儲在規模和適用性上被視為太昂貴,只適用于那些愿意為性能付錢的用戶。

真正的問題是廉價和深的思想將來是否會在企業級數據中心盛行。如果確實如此,節點級DAS作為Hadoop唯一的存儲層將很可能盛行,直到有人意識到持續增加服務器到集群來適應數據增長,同時會有越來越多的增長維護問題和管理開銷方面成本影響。如果不是這樣,為了業務連續和數據存儲目的SAN 和/或 NAS將作為一級或二級存儲層,并且存儲管理員的技能將被再次加分。

責任編輯:黃丹 來源: TechTarget中國
相關推薦

2013-01-08 10:01:56

HDFS

2015-04-16 14:24:56

Hadoop云計算HDFS

2013-05-28 09:12:59

Hadoop 2.0

2020-10-29 18:53:38

HDFSNameNodeDataNode

2010-06-07 13:35:16

Hadoop簡介

2018-12-27 12:34:42

HadoopHDFS分布式系統

2019-04-18 11:37:49

NameNodeHDFS架構

2019-09-23 13:03:42

NameNode元數據文件

2017-06-08 11:00:09

HDFSHadoopYARN

2019-11-06 08:54:21

HDFSHadoopMapReduce

2017-08-03 10:38:32

HADOOP1.XHDFSHadoop

2014-07-15 11:15:44

hadoop分布式部署

2013-04-23 11:17:47

Hadoop

2019-07-17 13:25:03

SparkHadoop架構

2013-07-11 13:39:23

Hadoop

2010-06-03 15:13:34

Hadoop Hdfs

2019-03-21 11:03:47

HDFSMapReduceHadoop

2019-09-24 13:41:22

Hadoop面試分布式

2021-04-14 08:51:55

HDFSJavaPython

2013-01-09 10:16:09

HDFS
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 亚洲精品国产一区 | 999久久久国产精品 欧美成人h版在线观看 | 日韩在线观看一区 | 91麻豆精品国产91久久久更新资源速度超快 | 国产jizz女人多喷水99 | 亚洲 欧美 精品 | 国产精品区一区二区三 | 久草热视频 | 久久久久久免费看 | 在线观看第一区 | 国产精品电影在线观看 | 99久久免费精品国产男女高不卡 | 久久精品国产一区二区三区不卡 | 国产日韩精品视频 | 91视频在线看 | 伊人网综合在线观看 | 午夜精品福利视频 | 欧美日韩综合一区 | 成人在线观看免费观看 | 久久偷人 | 午夜精品久久久久久久久久久久久 | 久久久久网站 | 亚洲 欧美 综合 | 欧美xxxx色视频在线观看免费 | 69xxx免费| 日韩欧美手机在线 | 亚洲综合色婷婷 | 国产精品视频一二三区 | 91视频国产一区 | 国产乱码一二三区精品 | 日韩欧美中文字幕在线观看 | 一本大道久久a久久精二百 国产成人免费在线 | 日韩在线第一 | 国产激情在线播放 | 粉嫩一区二区三区国产精品 | 91精品国产乱码久久久久久久久 | 亚洲激情在线 | 国产精品久久久久久久 | 亚洲欧洲在线观看视频 | 久久久这里都是精品 | 久久久精品网 |