成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Hadoop分布式文件系統詳解

開發 架構 分布式 Hadoop
Hadoop相信大家應該有所了解,這里向大家介紹一下Hadoop分布式文件系統,相信通過本文的介紹大家對Hadoop分布式文件系統有一定的認識。

在學習Hadoop的過程中,你可能遇到Hadoop分布式文件系統方面的內容,本節就向大家介紹一下,歡迎大家一起來學習Hadoop分布式文件系統方面的知識。下面是具體介紹。

Hadoop分布式文件系統

Hadoop分布式文件系統(HDFS)被設計成適合運行在通用硬件(commodityhardware)上的分布式文件系統。它和現有的分布式文件系統有很多共同點。但同時,它和其他的分布式文件系統的區別也是很明顯的。HDFS是一個高度容錯性的系統,適合部署在廉價的機器上。HDFS能提供高吞吐量的數據訪問,非常適合大規模數據集上的應用。HDFS放寬了一部分POSIX約束,來實現流式讀取文件系統數據的目的。HDFS在最開始是作為ApacheNutch搜索引擎項目的基礎架構而開發的。HDFS是ApacheHadoopCore項目的一部分。這個項目的地址是http://hadoop.apache.org/core/。

前提和設計目標

硬件錯誤
硬件錯誤是常態而不是異常。HDFS可能由成百上千的服務器所構成,每個服務器上存儲著文件系統的部分數據。我們面對的現實是構成系統的組件數目是巨大的,而且任一組件都有可能失效,這意味著總是有一部分HDFS的組件是不工作的。因此錯誤檢測和快速、自動的恢復是HDFS最核心的架構目標。

流式數據訪問
運行在HDFS上的應用和普通的應用不同,需要流式訪問它們的數據集。HDFS的設計中更多的考慮到了數據批處理,而不是用戶交互處理。比之數據訪問的低延遲問題,更關鍵的在于數據訪問的高吞吐量。POSIX標準設置的很多硬性約束對HDFS應用系統不是必需的。為了提高數據的吞吐量,在一些關鍵方面對POSIX的語義做了一些修改。

大規模數據集
運行在Hadoop分布式文件系統HDFS上的應用具有很大的數據集。HDFS上的一個典型文件大小一般都在G字節至T字節。因此,HDFS被調節以支持大文件存儲。它應該能提供整體上高的數據傳輸帶寬,能在一個集群里擴展到數百個節點。一個單一的HDFS實例應該能支撐數以千萬計的文件。

簡單的一致性模型
HDFS應用需要一個“一次寫入多次讀取”的文件訪問模型。一個文件經過創建、寫入和關閉之后就不需要改變。這一假設簡化了數據一致性問題,并且使高吞吐量的數據訪問成為可能。Map/Reduce應用或者網絡爬蟲應用都非常適合這個模型。目前還有計劃在將來擴充這個模型,使之支持文件的附加寫操作。

“移動計算比移動數據更劃算”
一個應用請求的計算,離它操作的數據越近就越高效,在數據達到海量級別的時候更是如此。因為這樣就能降低網絡阻塞的影響,提高系統數據的吞吐量。將計算移動到數據附近,比之將數據移動到應用所在顯然更好。HDFS為應用提供了將它們自己移動到數據附近的接口。

異構軟硬件平臺間的可移植性
HDFS在設計的時候就考慮到平臺的可移植性。這種特性方便了HDFS作為大規模數據應用平臺的推廣。

Namenode和Datanode
Hadoop分布式文件系統HDFS采用master/slave架構。一個HDFS集群是由一個Namenode和一定數目的Datanodes組成。Namenode是一個中心服務器,負責管理文件系統的名字空間(namespace)以及客戶端對文件的訪問。集群中的Datanode一般是一個節點一個,負責管理它所在節點上的存儲。HDFS暴露了文件系統的名字空間,用戶能夠以文件的形式在上面存儲數據。從內部看,一個文件其實被分成一個或多個數據塊,這些塊存儲在一組Datanode上。Namenode執行文件系統的名字空間操作,比如打開、關閉、重命名文件或目錄。它也負責確定數據塊到具體Datanode節點的映射。Datanode負責處理文件系統客戶端的讀寫請求。在Namenode的統一調度下進行數據塊的創建、刪除和復制。

Namenode和Datanode被設計成可以在普通的商用機器上運行。這些機器一般運行著GNU/Linux操作系統(OS)。HDFS采用Java語言開發,因此任何支持Java的機器都可以部署Namenode或Datanode。由于采用了可移植性極強的Java語言,使得HDFS可以部署到多種類型的機器上。一個典型的部署場景是一臺機器上只運行一個Namenode實例,而集群中的其它機器分別運行一個Datanode實例。這種架構并不排斥在一臺機器上運行多個Datanode,只不過這樣的情況比較少見。
集群中單一Namenode的結構大大簡化了系統的架構。Namenode是所有HDFS元數據的仲裁者和管理者,這樣,用戶數據永遠不會流過Namenode。本節關于Hadoop分布式文件系統方面的介紹到這里。
 

【編輯推薦】

  1. Hadoop集群搭建過程中相關環境配置詳解
  2. Hadoop完全分布模式安裝實現詳解
  3. 專家講解 Hadoop:HBASE松散數據存儲設計
  4. 兩種模式運行Hadoop分布式并行程序
  5. Hadoop應用之Hadoop安裝篇

 

 

責任編輯:佚名 來源: csdn.net
相關推薦

2011-07-15 17:48:27

Platform

2010-11-01 05:50:46

分布式文件系統

2018-07-06 09:16:22

HadoopRAID文件系統

2018-03-01 16:26:30

HDFSHadoop系統

2017-10-17 08:33:31

存儲系統分布式

2012-08-31 16:04:11

HDFS分布式文件系統

2013-06-18 14:00:59

HDFS分布式文件系統

2010-11-15 13:24:07

分布式文件系統

2013-01-07 10:29:31

大數據

2016-09-14 23:51:23

2012-09-19 15:05:24

MogileFS分布式文件系統

2012-09-19 13:43:13

OpenAFS分布式文件系統

2018-08-14 10:44:58

HadoopHDFS命令

2018-01-18 17:14:58

分布式文件系統FastDFS

2013-05-27 14:46:06

文件系統分布式文件系統

2012-10-09 16:43:47

FastDFS分布式文件系統

2011-03-16 14:23:38

分布式文件

2020-01-03 08:33:57

Ceph硬件系統

2012-05-10 15:23:53

分布式文件系統測試

2023-05-05 08:16:56

SeaweedFS分布式文件
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 91看片网| a级毛片国产| 婷婷桃色网 | 免费观看www | 51ⅴ精品国产91久久久久久 | 亚洲精品大片 | 国产一区 在线视频 | 一区二区三区国产精品 | 成人欧美一区二区三区在线播放 | 国产精品久久久久久久一区探花 | 欧美亚洲视频在线观看 | 亚洲欧美另类在线观看 | 中文字幕欧美在线观看 | 久久久久国产一级毛片高清网站 | 久久精品福利 | 亚洲视频在线播放 | 国产精品综合 | 国产精品视屏 | 成人免费视屏 | 国产成人av在线播放 | 一区二区三区四区不卡 | 九九导航 | 久久不卡 | 农村妇女毛片精品久久久 | 91精品国产91久久久久福利 | 欧美一区二区三区四区五区无卡码 | 精品久久一区二区三区 | 91小视频在线| 韩日一区 | 国产伦一区二区三区视频 | 国产精品久久久久久久久久免费看 | 国产一级淫片免费视频 | 韩日在线视频 | 久久精品亚洲一区 | 国产福利视频导航 | av中文在线 | 日韩欧美三区 | 日韩精品视频一区二区三区 | 国产精品区一区二 | 国产激情在线 | 精品伊人 |