成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

分布式存儲系統(tǒng)在大數(shù)據(jù)處理中扮演著怎樣的角色?

存儲 存儲架構(gòu)
如果存儲節(jié)點(diǎn)本身可以定制,則通常會讓其支持部分計算能力,以利用數(shù)據(jù)的親和性,將部分計算下推到相關(guān)的存儲節(jié)點(diǎn)上。如果存儲是云上的 S3 等對象存儲,無法定制,則通常會將數(shù)據(jù)在計算節(jié)點(diǎn)緩存,并且盡量的復(fù)用。 參考資料

大概總結(jié)下,主要包括以下角色:

1. 數(shù)據(jù)的源頭與終點(diǎn)

傳統(tǒng)上,無論是基于 MapReduce 的數(shù)據(jù)流,還是基于 Spark/Flink 的流水線,其數(shù)據(jù)的來源和最終落腳點(diǎn)都可以是分布式存儲(比如 GFS、HDFS、S3)。

這是由于分布式存儲通常具有很高的可用性,不太用擔(dān)心數(shù)據(jù)丟失。但從另一方面來說,上面提到的幾種分布式存儲通常不具有數(shù)據(jù)庫中的 Schema,導(dǎo)致在用的時候,缺少一些靈活性。

當(dāng)然,對于流式系統(tǒng)來說,分布式存儲肯定不是最典型的數(shù)據(jù)來源,而是各種在線的服務(wù)產(chǎn)生的事件。

2. 中間數(shù)據(jù)的落腳點(diǎn)

對于批處理的中間數(shù)據(jù),如果量過大或者計算代價太大,比如 Spark 中的 RDD,會:

  1. 內(nèi)存裝不下 spill 到分布式存儲中
  2. 在 shuffle 后,為了避免重算,通常要持久化到分布式存儲系統(tǒng)上一份

即使是如 Flink 之類的流式處理系統(tǒng),最近也在提存算分開——將中間狀態(tài)外存,計算才能更好的擴(kuò)縮容。傳統(tǒng)上 Flink 使用了 RocksDB 之類的存儲引擎,將狀態(tài)數(shù)據(jù)存在各個計算節(jié)點(diǎn)本地;但為了上云,讓計算更方便的彈性,也開始尋求將所有中間狀態(tài)與計算節(jié)點(diǎn)解耦合,存到統(tǒng)一的分布式存儲中。

3. 分布式數(shù)據(jù)庫的基座

隨著數(shù)據(jù)庫本身越來越多的支持分布式部署和計算,傳統(tǒng)上的大數(shù)據(jù)處理需求,一部分被內(nèi)化為查詢引擎層的分布式計算。這也是為什么,現(xiàn)代分布式數(shù)據(jù)庫的查詢引擎也多使用 MPP 方式,充分的利用多節(jié)點(diǎn)的計算能力,在單個查詢內(nèi)進(jìn)行算子或者流水線粒度的分布式并行執(zhí)行。

在這種情況下,分布式數(shù)據(jù)庫的底層存儲通常為分布式(KV)存儲,且是和計算分離的(存算分開)。也就是說,數(shù)據(jù)通過查詢引擎層,最終會以 KV 的形式落到分布式存儲中,并供之后的查詢支持。

如果存儲節(jié)點(diǎn)本身可以定制,則通常會讓其支持部分計算能力,以利用數(shù)據(jù)的親和性,將部分計算下推到相關(guān)的存儲節(jié)點(diǎn)上。如果存儲是云上的 S3 等對象存儲,無法定制,則通常會將數(shù)據(jù)在計算節(jié)點(diǎn)緩存,并且盡量的復(fù)用。

參考資料

[1]《系統(tǒng)日知錄》專欄: https://xiaobot.net/p/system-thinking ,點(diǎn)擊下面閱讀原文跳轉(zhuǎn)訂閱。

責(zé)任編輯:武曉燕 來源: 木鳥雜記
相關(guān)推薦

2017-07-11 16:37:10

測試管理DevOps

2020-08-11 13:21:00

藍(lán)牙工業(yè)物聯(lián)網(wǎng)IIOT

2023-02-01 11:15:21

數(shù)字化轉(zhuǎn)型CIO

2020-10-22 08:06:40

私有網(wǎng)絡(luò)物聯(lián)網(wǎng)IOT

2022-03-06 23:09:24

區(qū)塊鏈房地產(chǎn)技術(shù)

2020-12-04 05:12:54

超尺度物聯(lián)網(wǎng)平臺物聯(lián)網(wǎng)

2017-12-18 10:47:04

分布式存儲數(shù)據(jù)

2017-04-14 09:48:25

分布式存儲系統(tǒng)

2018-09-29 14:08:04

存儲系統(tǒng)分布式

2022-03-01 08:40:34

StormHadoop批處理

2017-07-18 09:51:36

文件存儲系統(tǒng)

2017-10-16 10:24:47

LogDevice存儲系統(tǒng)

2017-10-12 09:36:54

分布式存儲系統(tǒng)

2017-10-19 08:45:15

存儲系統(tǒng)HBase

2018-11-20 09:19:58

存儲系統(tǒng)雪崩效應(yīng)

2018-03-13 08:45:08

存儲系統(tǒng)DHT算法

2010-07-02 10:08:12

BigtableGoogle

2017-10-17 08:33:31

存儲系統(tǒng)分布式

2018-06-08 08:46:14

RaftPaxos系統(tǒng)

2015-03-18 09:33:41

大數(shù)據(jù)分布式系統(tǒng)事務(wù)處理
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 亚洲精品久久久久久久久久久 | 日韩at| av一级久久 | 国产视频一区二区在线观看 | 中文字幕国产在线 | 在线国产一区二区 | 国产精品3区| 国产精品久久久av | 欧美精品在线播放 | 在线观看中文字幕视频 | 天天舔天天 | 国产视频二区 | 免费观看的黄色网址 | 亚洲国产精品一区二区第一页 | 日韩精品一区二区在线 | 亚洲精品二区 | 国产在线精品一区二区三区 | 久久九七| 少妇一区在线观看 | 日韩久久久久久久久久久 | 色婷婷一区二区三区四区 | 91麻豆精品国产91久久久更新资源速度超快 | 久久久高清 | 国产一级一级毛片 | 在线观看亚洲精品视频 | 久久综合国产 | 天堂色区 | 中文字幕亚洲区 | 91久久国产综合久久 | 亚洲精品在线观看视频 | 久久之精品 | 中文字幕精品一区二区三区在线 | 91精品国产综合久久精品 | 美女一区二区在线观看 | 成年网站在线观看 | 欧美日韩高清一区 | 国产精品美女久久久 | 精品一区二区三区四区外站 | 午夜视频在线观看视频 | 国产精品mv在线观看 | 久久夜色精品国产 |