什么是存儲?分享學習存儲的心得
小編自接觸存儲以來,一直沒有對存儲進行分類,感覺它的知識界限并不是那么的明顯,如果單單把它歸為一類的話確實有點牽強。
它有自己的知識主體也有其他內容的涵蓋,所以我認為存儲的內容比較廣泛和零散,概念比較多,下面我就分享一下學習存儲的心得。
一、首先要了解一些基本的概念
1、什么是數據及數據與信息的區別:數據可以理解為對所有事物的數字表示,信息是經過加工處理的數據,它是在數據層面上經過
提煉得出來的有價值的數據。其實這兩個概念都比較簡單,但是非常重要。
2、了解了數據及信息的定義后,大家會想這么多的數據哪些是有用的呢?數據是否有價值是誰來決定的呢?帶著這些問題,我們看一下
三個名詞,分別是:RPO、RTO、和 COT,如果僅僅對這3個名詞進行解釋的話效果并不好,會讓你聯想為死記硬背的概念。所以,我就用通俗易懂的話語來說一下三個名詞的作用:RPO的作用是統計發生災難時我到底丟失了多少數據;RTO的作用是我想要恢復丟失
的數據需要多長時間;COT的作用是災難期間我公司每小時損失的數據成本是多少。有興趣的話,大家可以去百度一下這三個名詞縮寫的具體含義。
3、第三個概念是現在比較流行的即ICT,ICT=IT+CT 就是信息技術與通信技術的融合。這個也是華為未來的發展方向。
4、***說一下ICT的基礎架構,其實可以理解為存儲的架構,我們可以簡單的理解為:主機+網絡+存儲,隨著學習的深入以后會慢慢的豐富這個架構。
基本定義說完以后接下來說一下現在存儲里面比較流行的三種解決方案,雖然很多人都聽過但是真正能理解的人卻不算太多。
二、DAS、NAS、SAN
又是三個英文單詞的縮寫,如果想真正理解其含義及作用,必須進行單獨的解析,下面我分別說一下三個名詞。
1、DAS:直連式存儲,可以理解為直接相連的存儲方案。也是最早的存儲設備,其他的不用多想知道它直連的就可以了。DAS一般分為兩種類型:內部DAS和外部DAS,兩者的區別是依據于連接位置區分的。處理器和存儲設備放在一起的就是內部DAS,例如服務器;處理器和存儲設備分離的就是外部DAS。DAS有個致命的缺陷就是連接距離***不能超過25m,這個缺陷顯示了DAS的發展。
2、NAS:網絡附加存儲,可以簡單的理解為通過網絡進行共享的技術,說白了就是共享服務,NAS常用的共享協議是NFS和CIFS,前者是類UNIX系統使用的協議,后者是Windows用的協議。NAS一般可以分為盤控一體和盤分離,盤指的是存儲陣列,控指的是控制器,一般的NAS設備最少是雙控(A控+B控)。
3、SAN:存儲區域網絡,它是DAS的升級版本,隨著數據和設備的增加,DAS已經不能滿足工作和生活的需要,所以出現了SAN,它彌補了DAS的不足。這三個技術的出現順序是DAS早于SAN,SAN早于NAS,是不是有點意外。
第三部分介紹這三個技術中涉及和使用到的協議,也是大家比較熟悉的名詞。
三、存儲常用的協議
1、ATA和SATA:其實這個定義可以不用記住,因為是比較老的東西,現在用的也不多,大家了解一下就可以了。
ATA是一種很早就出現的接口類型,后者是前者的改進即串行的ATA。
2、SCSI:這個出現的也是比較早,***由IBM公司提出來,前期用于小型機的接口,全稱叫“小型計算機系統接口”S(small)C(computer)S(system)I(interface)。后來又衍生出ISCSI。
3、SAS:就是串行的SCSI。
4、FC:光纖通道協議,它是光纖傳輸使用的協議。
接下來說一下市場上流行的幾種硬盤,他們各自的特點及區別。
四、常用的硬盤
1、SATA盤:比較早的硬盤,現在基本不用了,特點是存儲容量大,價格低;缺點是讀取速度慢,不適合頻繁的操作。
2、SAS盤:串行SCSI盤,現在比較流行的盤,特點是讀取速度快,價格適中,性價比高。
3、SSD盤:固態硬盤,特點是讀取速度極快,價格昂貴,生命周期短暫,性價比底。
4、NL-SAS:近線SAS,盤體采用的SATA,接口采用SAS,結合了兩者的優點于一身,主要用在容量盤中。
下面介紹RAID技術。
五、傳統RAID技術
RAID的定義:獨立磁盤冗余陣列,它的作用主要是容災和備份,容災可以理解為容許災難發生,備份就不用多說了,也可以理解為數據恢復技術還有就是保障數據的寫入和讀取的效率。
RAID根據業務不同的分為不同的等級:0、1、2、3、4、5、6、10、50等,其中2和4不常用,但是確實存在,剩下的
是比較常用的RAID級別,下面簡單的說一下幾個RAID的區別。
1、RAID0: 把數據同時寫入2塊硬盤,讀取效率提升50%,沒有備份盤,壞了就完了,不能恢復和重構數據,作用
僅僅是提高性能。一般單獨做RAID0的很少。
2、RAID1:把一樣的數據分別拷貝到兩個盤上,這兩個盤的數據完全一樣,缺點是硬盤的利用率只有50%,優點是當一個盤壞掉,另一個盤可以正常使用。
3、RAID3:最少需要4個硬盤,其中一個硬盤作為校驗盤,具有數據校驗的功能,所有校驗的信息都放到校驗盤中。當某個數據
丟失后,通過其他數據和校驗盤進行異或運算推出丟失的數據,優點:數據丟失后可以恢復,缺點:需要額外的校驗盤,還有一點就是存在“寫懲罰”。
4、RAID5:RAID3的升級版,去掉了校驗盤,所有校驗任務都平均分配到各個盤中,可以理解為分布式存儲,優點是數據恢復速度快,不需要校驗盤;缺點是:每個盤都參與校驗,硬盤使用頻率高,損壞的幾率也高。
5、RAID6:繼續升級,有2塊校驗盤,有2種校驗模式,例如:P+Q校驗 和 DP校驗,優點是其他RAID不能比擬的,它允許同時損壞2塊硬盤,是不是很給力。
6、***這個其實就2個組合:RAID10:先做RAID1,再做RAID0,這種模式性能和效率都很高比較流行。
RAID50:先做RAID5,再做RAID0
下面說一下兩個概念。
六、其他知識
1、大數據
SNIA(全球網絡存儲工業協會)對大數據下的定義是,在***大的計算平臺上都無法對全部數據進行有效的處理的數據集合。
提到數據不得不對其進行分類,我們可以簡單的分為2類:結構化數據和非結構化數據,當然也有人分為三類即增加了半結構化數據,
在這里我們簡單的分為2類即可。結構化數據是指用二維表可以邏輯的表示出來的數據,例如,Excel、數據庫等。非結構化數據是不能用二維表邏輯的表示出來,例如,圖片、視頻、文檔等。
2、云計算
云就是互聯網,就是互聯網計算。它有三種部署模式和三種商業模式,部署模式有:私有云、公有云和混合云,這里不詳細的介紹。商業模式有:IAAS(基礎架構就是一種服務)、PAAS(平臺也算是一種服務)、SAAS(軟件也是一種服務)綜上所述云計算就是賣服務的,就像電力集團賣電一樣。
七、RAID2.0+
上面說的RAID是傳統RAID技術,隨著技術的發展,主流廠商紛紛提出來新的RAID技術,RAID2.0+是華為推出的,它的核心思想是把數據平均分配到每個磁盤上,當讀取數據的時候所有磁盤都參與進來,這樣讀取的速率就會大大的增加。
首先將所有磁盤都劃分為單個的chunk,多個chunk組成一個chunk組(ckg)。從ckg中再細分成extent,根據磁盤類型的不同,extent的大小也不一樣。SAS盤和SSD盤中extent的大小為64M,NL-SAS盤extent的大小為256M,所有的extent組成一個卷,從卷中再映射出Lun,呈獻給用戶的就是一個個的Lun,一個Lun就是一個邏輯卷。其實在extent中還可以繼續劃分為更小的單位即grain,它是thin Lun的組成單位。