成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Hadoop分布式存儲與傳統(tǒng)SQL存儲比較及存儲操作描述

存儲 存儲軟件 分布式 Hadoop
Google 為了應對快速增長的數(shù)據(jù)處理,開發(fā)了一套算法。后來有人根據(jù)算法的思想,開發(fā)出開源的軟件框架 ,就是Hadoop, 隨著越來越多的組織和個人開發(fā)者在框架開發(fā)中不斷貢獻改進,Hadoop 已經(jīng)形成一套家族產(chǎn)品,成為當下最成功最流行的分布式大數(shù)據(jù)處理框架。

Google 為了應對快速增長的數(shù)據(jù)處理,開發(fā)了一套算法。后來有人根據(jù)算法的思想,開發(fā)出開源的軟件框架 ,就是Hadoop, 隨著越來越多的組織和個人開發(fā)者在框架開發(fā)中不斷貢獻改進,Hadoop 已經(jīng)形成一套家族產(chǎn)品,成為當下最成功***的分布式大數(shù)據(jù)處理框架。

Hadoop 受到很多組織青睞,是因為有兩大因素: 一、超大規(guī)模的數(shù)據(jù)處理, 通常 10TB 以上;二、超復雜的計算工作,例如統(tǒng)計和模擬。

Hadoop 在很多應用場景中發(fā)揮著主要功用,如大規(guī)模統(tǒng)計、ETL數(shù)據(jù)挖掘、大數(shù)據(jù)智能分析、機器學習等。

[[224707]]

Hadoop 和 傳統(tǒng)SQL關系數(shù)據(jù)存儲 有什么區(qū)別?

Hadoop 讀時模式(Schema on read),傳統(tǒng)SQL是 寫時模式(Schema on write).傳統(tǒng)數(shù)據(jù)庫存儲時對數(shù)據(jù)進行檢查,需要檢查表結構定義等必須匹配后才讓存儲(write),否則就報錯。Hadoop 是你拿過任何數(shù)據(jù)格式我都給你存儲,只要你給我讀取這些數(shù)據(jù)的接口程序,在用到這些數(shù)據(jù)時(read),才會檢查。

左邊是Schema on Read , 右邊是Schema on Write。 右邊數(shù)據(jù)格式不對會報錯;左邊更關注讀數(shù)據(jù)的規(guī)則

Hadoop 是分布式數(shù)據(jù)庫, 而大部分SQL 是集中存儲的。

舉例來講: 微信后臺有可能數(shù)千個服務器節(jié)點用于存儲微信聊天記錄,假設我的聊天記錄分布在60個不同的服務節(jié)點上。而對于關系數(shù)據(jù)庫,會集中在多個表空間中。

假如我搜索我的一個聊天記錄,Hadoop 會把搜索任務分成多個均衡負載的搜索任務運行在60個節(jié)點上。而傳統(tǒng)SQL會逐個搜索存儲空間,直到全部遍歷。如果沒有完全搜索完,會返回搜索結果嗎? Hadoop的回答是YES,而傳統(tǒng)SQL會是NO。

Hadoop 家族的產(chǎn)品 Hive,可以讓不怎么懂SQL 的客戶開發(fā)出基本上和SQL同樣功能的查詢

Hadoop 的數(shù)據(jù)寫入、備份、刪除操作

一、數(shù)據(jù)寫入

在客戶端想HDFS寫數(shù)據(jù)的過程中,主要分為下面幾個過程:

客戶端將數(shù)據(jù)緩存到本地的一個臨時文件中;

當這個本地的臨時文件到達HDFS中的塊大小限制時,客戶端訪問Namenode,Namenode將文件的名字插入到HDFS命名空間中,并且為其分配相應的存儲位置;

Namenode與分配好的Datanode進行溝通,確定存儲位置可用,然后將這些存儲位置信息返回給客戶端;

客戶端將本地的臨時文件傳輸?shù)紻atanode中;

當寫文件結束,臨時文件關閉時,會將已有的臨時數(shù)據(jù)傳輸?shù)紻atanode中,并告知Namenode寫數(shù)據(jù)完成;

Namenode將該文件改變?yōu)槌志玫囊恢滦誀顟B(tài),也就事將該操作記錄到日志EditLog中。如果此時Namenode宕掉,那么文件信息丟失。

上面的過程主要特點是寫入數(shù)據(jù)先緩存到本地,在達到塊大小限制時才與Datanode通信進行傳輸。這樣的好處在于避免在客戶寫數(shù)據(jù)的過程中持續(xù)占用網(wǎng)絡帶寬,這對于處理多用戶大量數(shù)據(jù)的寫入是非常關鍵的。

二、數(shù)據(jù)備份

數(shù)據(jù)的寫入同時伴隨這數(shù)據(jù)塊的備份,過程如下:

在客戶端臨時數(shù)據(jù)達到一個塊時,與Namenode通信,得到一組Datanode地址,這些Datanode就是用來存儲該數(shù)據(jù)塊的;

客戶端首先將該數(shù)據(jù)塊發(fā)送到一個Datanode上,Datanode在接受時是以4kb為單位進行,我們把這些小單位稱為緩存頁(參考了Linux管道文件的說法);

對于***個接到數(shù)據(jù)的Datanode,它把緩存頁中的數(shù)據(jù)寫入自己的文件系統(tǒng),另一方面,它又將這些緩存頁傳送給下一個Datanode;

重復3的過程,第二個Datanode又將緩存頁存儲在本地文件系統(tǒng),同時將它傳送給第三個Datanode;

如果HDFS中的備份數(shù)目設置為3,那么第三個Datanode就只需要將緩存頁存儲即可。

上面的過程中,數(shù)據(jù)塊從客戶端流向***個Datanode,然后再流向第二個,從第二個再到第三個,整個是一個流水線過程,中間不會有停頓。所以HDFS將它稱為Replication Pipelining。

為什么不采取客戶端同時向多個Datanode寫數(shù)據(jù)的方法呢?其實從Pipelining這個稱呼上就可以猜到,客戶端和Datanode采用的緩存文件都是管道文件,即只支持一次讀取。

三、 數(shù)據(jù)刪除

HDFS中的數(shù)據(jù)刪除也是比較有特點的,并不是直接刪除,而是先放在一個類似回收站的地方(/trash),可供恢復。

對于用戶或者應用程序想要刪除的文件,HDFS會將它重命名并移動到/trash中,當過了一定的生命期限以后,HDFS才會將它從文件系統(tǒng)中刪除,并由Namenode修改相關的元數(shù)據(jù)信息。并且只有到這個時候,Datanode上相關的磁盤空間才能節(jié)省出來,也就是說,當用戶要求刪除某個文件以后,并不能馬上看出HDFS存儲空間的增加,得等到一定的時間周期以后(現(xiàn)在默認為6小時)。

對于備份數(shù)據(jù),有時候也會需要刪除,比如用戶根據(jù)需要下調(diào)了Replicaion的個數(shù),那么多余的數(shù)據(jù)備份就會在下次Beatheart聯(lián)系中完成刪除,對于接受到刪除操作的Datanode來說,它要刪除的備份塊也是先放入/trash中,然后過一定時間后才刪除。因此在磁盤空間的查看上,也會有一定的延時。

那么如何立即徹底刪除文件呢,可以利用HDFS提供的Shell命令:bin/hadoop dfs expunge清空/trash。

責任編輯:武曉燕 來源: 互聯(lián)網(wǎng)東革阿里
相關推薦

2018-03-12 08:33:34

Hadoop存儲

2018-11-20 09:05:11

傳統(tǒng)存儲分布式存儲

2015-05-20 15:54:04

Openstack分布式存儲

2018-02-22 08:42:04

分布式存儲安全

2016-03-25 10:12:56

宏杉

2024-08-12 16:20:27

2015-05-12 13:03:54

開源分布式存儲HDFS

2023-07-05 00:09:13

分布式存儲架構

2018-04-13 09:01:58

存儲SANNAS

2009-01-16 15:00:42

DBASQL存儲過程

2017-10-27 08:40:44

分布式存儲剪枝系統(tǒng)

2017-01-10 16:18:26

分布式存儲建設

2021-10-08 10:45:41

分布式存儲Scale-up架構

2018-10-09 10:45:40

2018-01-02 20:00:28

數(shù)據(jù)庫MySQL分布式存儲

2017-04-14 09:48:25

分布式存儲系統(tǒng)

2018-04-03 09:19:49

虛擬化存儲分布式

2015-10-19 11:41:30

分布式存儲HDFSGFS

2018-09-29 14:08:04

存儲系統(tǒng)分布式

2018-10-29 12:51:35

分布式存儲元數(shù)據(jù)
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 亚洲a毛片 | 久久久久久久一区二区三区 | 麻豆精品一区二区三区在线观看 | 国产亚洲成av人在线观看导航 | av电影手机版 | 久久精品16 | 精品久久九 | 青青草亚洲 | 日韩成人在线视频 | 亚洲国产aⅴ成人精品无吗 欧美激情欧美激情在线五月 | jizz在线免费观看 | 婷婷久久五月 | 自拍偷拍中文字幕 | av片在线免费看 | 久久高清| 久久久影院 | 国产精品久久久久无码av | 免费在线观看黄视频 | 久久综合激情 | 婷婷久久精品一区二区 | 国产亚洲精品综合一区 | 国产人成精品一区二区三 | 色婷婷婷婷色 | 国产成人综合网 | 久久久免费毛片 | 久久久久久九九九九 | 在线免费黄色小视频 | 欧美a免费 | 伊人伊成久久人综合网站 | 国产精品1 | 一区二区三区电影在线观看 | 欧美日韩电影一区 | av一区二区在线观看 | 亚洲品质自拍视频 | 五月婷六月丁香 | chengrenzaixian | 91亚洲精品久久久电影 | 久久激情五月丁香伊人 | 国产三区精品 | 96av麻豆蜜桃一区二区 | 91免费看片 |