你叫不醒一個裝睡的人,我能!
早早收工回家,
赤腳蜷進沙發(fā),
聽著喜馬拉雅,
趕赴周公夜話。
噫!瀟灑!
“莫聽穿林打葉聲,何妨吟嘯且徐行,竹杖芒鞋輕勝馬……”一首《定風(fēng)波》徐徐吹入耳畔,沙發(fā)上的老周漸漸沒了動靜。
“老周,幫我擇點菜!”
沙發(fā)還是那座沙發(fā)。
“爸爸,陪我打游戲吧!”
沙發(fā)依舊是那座沙發(fā)。
“叮咚!”
沙發(fā)活了!
睜眼——起身——看手機——拿包——穿鞋出門,這套動作行云流水,是老周一氣呵成的佳作:“老婆,剛收到一封郵件,說公司有點急事兒,晚飯我就不跟你們一起吃了。”
“別的事兒叫不醒你,公司來點消息跑的比火箭都快……”周太太在廚房氣得直翻白眼。
同樣是存儲,差別為何辣么大!
這邊老周打車朝公司飛奔而去,一路上火急火燎:存儲磁盤突發(fā)故障,可是個棘手的問題啊,希望不會造成太大影響。
作為一家知名銀行的存儲管理員,老周每天的工作就是維護銀行數(shù)據(jù)中心的存儲系統(tǒng)正常運轉(zhuǎn),保障銀行業(yè)務(wù)的持續(xù)運行。
這家銀行歷史悠久,規(guī)模宏大,服務(wù)網(wǎng)點遍布全國各地,IT系統(tǒng)一直是重要的業(yè)務(wù)支撐手段,世界上有名的、沒名的各種牌子的存儲設(shè)備濟濟一堂,塞滿了一間屋子,行走在這些存儲設(shè)備之間,就跟逛萬國博覽會一樣。
對這些設(shè)備,老周像照顧自己孩子那樣認真細心,盡管每天操碎了心,但這些孩子還給老周帶來了無比的驕傲與自豪。
20分鐘后,老周到達現(xiàn)場,原來是一臺戴爾易安信SC存儲的硬盤報故障了,這臺存儲已經(jīng)運行N年,如今還是頭一次報錯。
按照操作手冊的提示,老周將壞盤標識,并啟動了RAID重構(gòu)進程。
這邊還沒處理完,那邊X家的一臺存儲坐不住了:一塊磁盤報故障。
雖然對老周這位經(jīng)驗豐富的系統(tǒng)管理員而言,磁盤故障處理實在是小菜一碟,但一天內(nèi)兩個廠家的存儲都出現(xiàn)壞盤的情況還真是不多見,沒辦法,X家的存儲也需要啟動RAID重構(gòu)進程了。
看著兩臺存儲上不停閃動的小紅燈,老周憂心如焚:這兩塊壞盤都是大容量磁盤,得恢復(fù)到啥時候啊?老天保佑,千萬不要在磁盤恢復(fù)的時候再發(fā)生壞盤情況了,數(shù)據(jù)一丟,可是要命的節(jié)奏呀。
▓ 一天之后,SC存儲的RAID重構(gòu)完成,謝天謝地!
“咦,怎么X家的還沒完?”老周泛起嘀咕,“難道是存儲太老了,性能有點差?”
又等了幾天,X家存儲的重構(gòu)才結(jié)束。
“奇怪,時間怎么差這么多,按理說就算X家的性能差點,也不至于有辣么大的差別吧!不行,我得研究研究。”結(jié)束故障處理后,學(xué)習(xí)模范老周立馬捧上兩家廠商的白皮書看起來。
原來,相比于X家,戴爾易安信的SC存儲并未采用傳統(tǒng)的“熱備盤”手段,而是使用了“熱備空間”(Distributed Spares Space)的技術(shù)。
熱備盤弊端凸顯
任何基于陣列的磁盤系統(tǒng),都是使用RAID來保護數(shù)據(jù),RAID技術(shù)發(fā)展至今已有三十多年的歷史,在保護數(shù)據(jù)免受磁盤故障影響方面頗具成效。
當磁盤發(fā)生故障時,RAID會使用鏡像或基于奇偶校驗的算法提供對數(shù)據(jù)的訪問,以實現(xiàn)數(shù)據(jù)冗余和提高性能,不過在某些情況下,如果磁盤發(fā)生故障,就必須先更換磁盤才能再次實現(xiàn)完全冗余。
為了加快磁盤更換進程,磁盤陣列可以包含專用的熱備盤驅(qū)動器。不過在重建操作期間,使用專用熱備盤的傳統(tǒng)磁盤陣列會將所有重建寫入都轉(zhuǎn)到單個磁盤,進而把重建速率限制為寫入此單個磁盤的速度,嚴重影響了磁盤的重構(gòu)速度。
另外,隨著磁盤容量增加,故障磁盤恢復(fù)重建的時間也越來越長。與摩爾增加晶體管密度的定律類似,隨著時間推移,磁盤驅(qū)動器的容量也在迅速增加,更大的硬盤驅(qū)動器則需要更長的重建時間,而在驅(qū)動器重建過程中,如果同一個磁盤組又有一塊磁盤變得不可用,就會導(dǎo)致數(shù)據(jù)永久丟失。
戴爾易安信熱備空間技術(shù)
在失效的磁盤重建操作中,主要的瓶頸是正在寫入數(shù)據(jù)的單個熱備磁盤驅(qū)動器,在單個磁盤,數(shù)據(jù)只能寫這么快。
提高驅(qū)動器寫入速度的典型解決方案是分散工作負載到更多的驅(qū)動器,從而可以在更多磁盤發(fā)生故障之前完成RAID組的重構(gòu)。
為此,戴爾易安信SC存儲做出了重大改變——采用分布式熱備空間,替換專用熱備盤,在每個其他磁盤驅(qū)動器上保留重建空間,主要目的正是要解決由較大的硬盤引起的日益增長的重建時間窗口問題。
▲點擊圖片,了解更多戴爾易安信SC存儲信息
分布式熱備空間技術(shù)下,驅(qū)動器總數(shù)和可用數(shù)量數(shù)組中的空間不會改變,唯一的變化發(fā)生在備用容量或備用空間的布局中,備用容量不是將所有的備用容量都放在專用熱備盤,而是分散在所有磁盤上,進而可提高磁盤組RAID重建的效率,并成倍地縮短重構(gòu)時間。
使用熱備空間技術(shù),可以獲得如下優(yōu)勢:
1
縮短磁盤重建時間
戴爾易安信SC系列存儲的RAID分布式備用空間功能,在多個磁盤并行寫入和讀取重建工作負載,可加快重建操作速度,在短時間內(nèi)實現(xiàn)全面的數(shù)據(jù)保護和冗余重構(gòu),與傳統(tǒng)熱備磁盤的單塊盤讀寫相比,效率提升了好幾倍。
2
提高整體RAID性能
在具有熱備盤的傳統(tǒng)RAID配置中,并非所有磁盤都存儲用戶數(shù)據(jù)。熱備盤只有在磁盤發(fā)生故障時,才參與RAID重建的讀寫操作,因此不會對整體陣列性能做出貢獻。例如,在具有12個磁盤的系統(tǒng)中,其中1個是熱備用磁盤,就只有11個磁盤參與貢獻系統(tǒng)的I/O。
但是,使用分布式備用空間就不一樣了,以前的熱備盤合并到用于用戶數(shù)據(jù)的磁盤集之中,磁盤陣列里每個磁盤都存儲用戶數(shù)據(jù),從每個磁盤中留出一小部分作為分布式備用容量,由此在磁盤總數(shù)保持不變的情況下,增加了貢獻用戶數(shù)據(jù)I/O的磁盤數(shù)量。比如上例中,12個磁盤都執(zhí)行用戶數(shù)據(jù)的I/O操作,隨機工作負載有效增長了8%。
3
延長磁盤的使用壽命
最后,分布式備用磁盤將每個磁盤的一部分留作備用容量,相較于傳統(tǒng)的專用熱備盤系統(tǒng),這種配置減少了熱備盤驅(qū)動器的工作量,可有效延長旋轉(zhuǎn)硬盤和固態(tài)硬盤的使用壽命。
“嘖嘖,熱備空間技術(shù)真不錯,這次存儲磁盤故障,要給戴爾易安信SC存儲點個大大的贊,重建快,又沒有任何數(shù)據(jù)丟失,以后得建議領(lǐng)導(dǎo)多采買些SC存儲了,靠譜兒!”老周撫摸著SC存儲,臉上露出慈父般的笑容。
相關(guān)閱讀推薦:物競天擇,“ADAPT”者生存!