成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Hadoop簡介:Hadoop的應用場合及其核心設計

開發 架構 Hadoop
Hadoop相信大家應該有所了解,這里向大家介紹一下Hadoop簡介中Hadoop的應用場合以及Hadoop框架中最核心的設計,歡迎大家一起來學習有關Hadoop方面的知識。

本節向大家描述一下Hadoop簡介,主要包括Hadoop應用場合和Hadoop框架中最核心的設計等內容,相信通過本節的學習大家對Hadoop有全面的認識,讓我們一起來了解一下Hadoop吧。

Hadoop簡介

1.Hadoop的應用場合:

適合海量數據的分析,其實Google最早提出MapReduce也就是為了海量數據分析。同時HDFS最早是為了搜索引擎實現而開發的,后來才被用于分布式計算框架中。海量數據被分割于多個節點,然后由每一個節點并行計算,將得出的結果歸并到輸出。同時***階段的輸出又可以作為下一階段計算的輸入,因此可以想象到一個樹狀結構的分布式計算圖,在不同階段都有不同產出,同時并行和串行結合的計算也可以很好地在分布式集群的資源下得以高效的處理。

2.Hadoop框架中最核心的設計
Hadoop簡介中Hadoop框架中最核心的設計就是:MapReduce和HDFS,MapReduce的思想是由Google的一篇論文所提及而被廣為流傳的,簡單的一句話解釋MapReduce就是“任務的分解與結果的匯總”。HDFS是Hadoop分布式文件系統(HadoopDistributedFileSystem)的縮寫,為分布式計算存儲提供了底層支持。

MapReduce:
名字上來看就大致可以看出個緣由,兩個動詞Map和Reduce,“Map(展開)”就是將一個任務分解成為多個任務,“Reduce”就是將分解后多任務處理的結果匯總起來,得出***的分析結果。這不是什么新思想,其實在前面提到的多線程,多任務的設計就可以找到這種思想的影子。不論是現實社會,還是在程序設計中,一項工作往往可以被拆分成為多個任務,任務之間的關系可以分為兩種:一種是不相關的任務,可以并行執行;另一種是任務之間有相互的依賴,先后順序不能夠顛倒,這類任務是無法并行處理的。

上圖就是MapReduce大致的結構圖,在Map前還可能會對輸入的數據有Split(分割)的過程,保證任務并行效率,在Map之后還會有Shuffle(混合)的過程,對于提高Reduce的效率以及減小數據傳輸的壓力有很大的幫助。后面會具體提及這些部分的細節。
Hadoop簡介中的HDFS的工作流程圖:

整個流程圖中有三個重要角色:NameNode、DataNode和Client。NameNode可以看作是分布式文件系統中的管理者,主要負責管理文件系統的命名空間、集群配置信息和存儲塊的復制等。NameNode會將文件系統的Meta-data存儲在內存中,這些信息主要包括了文件信息、每一個文件對應的文件塊的信息和每一個文件塊在DataNode的信息等。DataNode是文件存儲的基本單元,它將Block存儲在本地文件系統中,保存了Block的Meta-data,同時周期性地將所有存在的Block信息發送給NameNode。Client就是需要獲取分布式文件系統文件的應用程序。這里通過三個操作來說明他們之間的交互關系。

文件寫入:
1.Client向NameNode發起文件寫入的請求。
2.NameNode根據文件大小和文件塊配置情況,返回給Client它所管理部分DataNode的信息。
3.Client將文件劃分為多個Block,根據DataNode的地址信息,按順序寫入到每一個DataNode塊中。

文件讀取:
1.Client向NameNode發起文件讀取的請求。
2.NameNode返回文件存儲的DataNode的信息。
3.Client讀取文件信息。

文件Block復制:
1.NameNode發現部分文件的Block不符合最小復制數或者部分DataNode失效。
2.通知DataNode相互復制Block。
3.DataNode開始直接相互復制。
3.MapReduce和HDFS來看Hadoop的結構:

Hadoop結構示意圖

在Hadoop的系統中,會有一臺Master,主要負責NameNode的工作以及JobTracker的工作。JobTracker的主要職責就是啟動、跟蹤和調度各個Slave的任務執行。還會有多臺Slave,每一臺Slave通常具有DataNode的功能并負責TaskTracker的工作。TaskTracker根據應用要求來結合本地數據執行Map任務以及Reduce任務。本節關于Hadoop簡介描述完畢,請關注本節其他相關報道。
 

【編輯推薦】

  1. Hadoop簡介:HDFS和MapReduce的實現
  2. 術語匯編 Hadoop簡介
  3. Hadoop文件系統如何快速安裝?
  4. Hadoop集群搭建過程中相關環境配置詳解
  5. Hadoop完全分布模式安裝實現詳解

 

 

責任編輯:佚名 來源: csdn.net
相關推薦

2010-06-13 16:53:15

UML類

2012-07-12 09:41:42

2010-08-16 13:25:06

DIV

2017-01-17 09:38:52

ZooKeeperHadoopHBase

2010-06-04 10:01:26

Hadoop安裝

2010-06-07 13:02:46

Hadoop簡介

2010-08-19 13:43:07

marginpadding

2010-06-07 13:35:16

Hadoop簡介

2012-03-12 10:09:50

Hadoop微軟大數據

2017-09-18 17:59:23

Hadoop數據分析

2010-06-04 09:43:47

hadoop應用

2010-06-03 18:32:51

Hadoop

2012-09-19 14:09:20

Hadoop開源

2012-07-03 10:57:54

Hadoop核心機制

2015-07-29 10:36:05

hadoop數據挖掘

2019-10-31 09:52:02

HadoopJava大數據

2010-06-07 13:23:56

Hadoop 學習總結

2010-06-03 19:58:54

Hadoop

2019-06-18 14:12:07

Hadoop大數據數據庫

2010-06-24 17:14:16

Linux chkco
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 日韩一区二区在线视频 | 国产成人免费视频网站高清观看视频 | 日韩精品视频中文字幕 | 日韩久久精品 | 日韩电影中文字幕 | 黄色日本片 | 国产一级黄色网 | 欧美一级在线视频 | 精品国产乱码久久久久久丨区2区 | 国产伦精品一区二区三区精品视频 | 欧美极品在线视频 | 久久99久久99精品免视看婷婷 | 91亚洲国产 | 国产免费一区二区三区网站免费 | 午夜影院在线观看免费 | 久久男人| 一本在线| 99热.com| 日韩在线播放中文字幕 | 97国产在线视频 | 妖精视频一区二区三区 | 午夜久久久久久久久久一区二区 | 一级毛片免费视频观看 | 精品国产欧美一区二区三区不卡 | 一区二区三区在线播放 | 日韩精品在线播放 | 日韩一二区在线 | 国产精品日韩一区二区 | 亚洲精品一区二区另类图片 | 日韩精品一区二区三区视频播放 | 免费国产视频在线观看 | 国产精品18久久久久久久 | 91麻豆产精品久久久久久 | a级免费观看视频 | 久久久久久国产 | 黄色小视频大全 | 久久精品中文字幕 | 天天搞天天搞 | 一级毛片视频 | 91免费电影 | 国产成人免费视频网站视频社区 |