成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

分布式存儲系統可靠性如何估算?

存儲 存儲軟件 分布式
常規情況下,我們一般使用多副本技術來提高存儲系統的可靠性,無論是結構化數據庫存儲 (如典型的 mysql)、文檔型 Nosql 數據庫存儲 (mongodb ) 或者是常規的 blob 存儲系統 (GFS、Hadoop) 等,無不如此。

常規情況下,我們一般使用多副本技術來提高存儲系統的可靠性,無論是結構化數據庫存儲 (如典型的 mysql)、文檔型 Nosql 數據庫存儲 (mongodb ) 或者是常規的 blob 存儲系統 (GFS、Hadoop) 等,無不如此。

因為數據幾乎可以稱得上是企業生命力的核心,保障數據存儲系統的可靠性對于任何企業來說都不是一件小事。

那么,如何較為準確地去衡量集群數據的可靠性?如何進行系統設計使得集群數據達到更高的可靠性?本文將試著去解答這些問題。

[[214781]]

數據丟失與 copyset(復制組)

“在由 999 塊磁盤組成的 3 副本存儲系統中,同時壞三塊盤的情況下數據丟失的概率是多大? ”,這個跟存儲系統的設計息息相關,我們先考慮兩個極端設計下的情況。

設計一:把 999 塊磁盤組成 333 塊磁盤對。

在這種設計下,只有選中其中一個磁盤對才會發生數據丟失。這種設計中,丟失數據的概率為 333/C(999,3) = 5.025095326058336*e-07。

設計二:數據隨機打散到 999 塊盤中。

極端情況下,隨機一塊盤上的邏輯數據的副本數據打散在所有集群中的 998 塊盤中。這種設計下,丟失數據的概率為 C(999,3)/C(999,3)=1,也就是必然存在。

通過這兩種極端的例子我們可以看到,數據的丟失概率跟數據的打散程度息息相關。為了方便后續閱讀,這里我們引入一個新的概念 copyset (復制組)。

CopySet:包含一個數據的所有副本數據的設備組合,比如一份數據寫入 1,2,3 三塊盤,那么 {1,2,3} 就是一個復制組。

9 個磁盤的集群中,最小情況下的 copyset 的組合數為 3,copysets = {1,2,3}、{4,5,6}、{7,8,9},即一份數據的寫入只能選擇其中一個復制組,那么只有 {1,2,3}、{4,5,6} 或者 {7,8,9} 同時壞的情況下才會出現數據丟失。即最小 copyset 數量為 N/R。

系統中***的 copyset 的數目為 C(N,R) ,其中 R 為副本數,N 為磁盤的數量。在完全隨機選擇節點寫入副本數據的情況下,系統中的 copyset 數目會達到***值 C(N,R)。即任意選擇 R 個磁盤都會發生一部分數據的三個副本都在這 R 個盤上的情況。

磁盤數量 N,副本為 R 的存儲系統中,copyset 數量 S, N/R < S < C(N, R)

磁盤故障與存儲系統可靠性估算

1. 磁盤故障與柏松分布

在正式估算相關概率之前還需要科普一個基礎的概率學分布:柏松分布。柏松分布主要描述在一個系統中隨機事件發生的概率,譬如描述汽車站臺候客人數為某個值的概率,某個醫院 1 小時內出生 N 個新生兒的概率等等。

如上為泊松分布的公式。其中,P 表示概率,N 表示某種函數關系,t 表示時間,n 表示數量,λ 表示事件的頻率。

舉個例子:1000 塊磁盤在 1 年內出現 10 塊故障的概率為 P (N(365) = 10) [注:t 的平均單位為天]。λ 為 1000 塊磁盤 1 天內發生故障磁盤的數量,按照 google 的統計,年故障率在 8%,那么 λ = 1000*8%/365 。

如上只是損壞 N 塊磁盤概率的統計,那么怎么利用這個公式計算分布式系統中數據可靠性 (即數據丟失概率) 的近似值呢?

2. 分布式存儲系統中丟失率的估算

2.1 T 時間內的故障率

對于分布式存儲系統中如何進行年故障率的估算,我們先假定一種情況:T 為 1 年的情況下,系統存滿數據,壞盤不處理,這種情況下統計一下數據的年故障率。

這里我們先定義一些值

N: 磁盤數量

T:統計時間

K:壞盤數量

S:系統中 copyset 數量 (復制組的個數)

R:備份數量

如何計算 T(1年)時間內數據丟失的概率,從概率統計角度來說就是把 T (1 年) 時間內所有可能出現數據丟失的事件全部考慮進去。包含 N 個磁盤 R 副本冗余的系統中,在 T 時間內可能出現數據丟失的事件,即壞盤大于等于 R 的事件,即 R,R+1,R+2,… N ( 即為 K∈[R,N] 區間所有的事件 )。這些隨機事件發生時,什么情況下會造成數據丟失?沒錯,就是***復制組的情況下。

K 個損壞情況下 (隨機選擇 K 個盤情況下) ***復制組的概率為:

p = X/C(N,K) 其中 X 為隨機選擇 K 個磁盤過程中***復制組的組合數

那么系統出現 K 個磁盤損壞造成數據丟失的概率為:

Pa(T,K) = p * P(N(T)=K)

***系統中 T 時間內出現數據丟失的概率為所有可能出現數據丟失的事件的概率總和。

Pb(T) = Σ Pa(T,K) ; K∈[R,N]

2.2 分布式系統衡量年故障率

以上我們假設在一年中,不對任何硬件故障做恢復措施,那么 t 用一年代入即可算出此種系統狀態下的年故障率。但是在大規模存儲系統中,數據丟失情況下往往會啟動恢復程序,恢復完了之后理論上又算是從初始狀態的隨機事件,加入這個因素之后計算可靠性會變得比較復雜。

理論上大規模存儲系統中壞盤、恢復是極其復雜的連續事件,這里我們把這個概率模型簡化為不同個單位時間 T 內的離散事件來進行統計計算。只要兩個 T 之間連續事件發生的概率極小,并且 T 時間內絕大部份壞盤情況能夠恢復,那么下個時間 T 就是重新從新的狀態開始,則這種估算能夠保證近似正確性。T 的單位定義為小時,那么 1 年可以劃分為 365*24/T 個時間段,那么系統的年故障率可以理解為 100% 減去所有單位 T 時間內都不發生故障的概率。

即系統整體丟失數據的概率為:Pc = 1 - (1-Pb(T))*(36524/T)

 

責任編輯:武曉燕 來源: segmentfault
相關推薦

2021-07-30 09:49:17

分布式架構系統

2015-05-27 14:25:08

HDFS HA分布式存儲系統

2022-01-12 09:01:24

分布式系統容錯服務

2017-04-14 09:48:25

分布式存儲系統

2018-09-29 14:08:04

存儲系統分布式

2017-10-16 10:24:47

LogDevice存儲系統

2017-07-18 09:51:36

文件存儲系統

2017-10-17 08:33:31

存儲系統分布式

2017-12-18 10:47:04

分布式存儲數據

2017-10-12 09:36:54

分布式存儲系統

2017-10-19 08:45:15

存儲系統HBase

2018-11-20 09:19:58

存儲系統雪崩效應

2018-10-29 12:42:23

Ceph分布式存儲

2013-12-27 10:56:42

分布式對象存儲Sheepdog性能測試

2014-02-19 11:37:57

分布式對象存儲Sheepdog

2010-07-02 10:08:12

BigtableGoogle

2021-08-07 05:00:20

存儲系統

2025-01-26 11:54:39

分布式存儲系統

2018-03-13 08:45:08

存儲系統DHT算法

2019-10-15 10:59:43

分布式存儲系統
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 久久久成人一区二区免费影院 | 成人在线视频免费观看 | 亚洲国产精品99久久久久久久久 | 久草网站 | 国产高清免费视频 | 第一av| 国产日韩欧美在线 | 草草视频在线免费观看 | 综合自拍| 欧美日韩一区二区在线播放 | 久久精品久久精品久久精品 | 日本午夜精品 | 国产精品自产拍 | 亚洲成色777777在线观看影院 | 午夜影晥 | 精品国产乱码久久久久久1区2区 | 色婷婷久久 | 毛片a| 国产精品久久久久久久久久久久冷 | 正在播放国产精品 | 在线视频一区二区三区 | 成人区精品一区二区婷婷 | 国产精品一区二区三级 | 日本成人二区 | 最新av在线播放 | 国产亚洲精品美女久久久久久久久久 | 99精品一区二区 | 日韩一区二区三区在线观看视频 | 精品国产欧美日韩不卡在线观看 | 久色视频在线观看 | 久久福利 | 成在线人视频免费视频 | www.av7788.com | 一区二区成人 | 欧美色999 | 亚洲精品免费在线观看 | 91日b| 欧美成人精品欧美一级 | 日韩av美女电影 | 精品久久久久久亚洲综合网 | 久久极品 |