重復(fù)數(shù)據(jù)刪除技術(shù)實(shí)施主存儲(chǔ)優(yōu)化
主要文件系統(tǒng)存儲(chǔ)優(yōu)化(也就是在同樣的空間塞進(jìn)更多的數(shù)據(jù))繼續(xù)在日益普及。這里的挑戰(zhàn)是主存儲(chǔ)的重復(fù)數(shù)據(jù)刪除并不是沒有規(guī)則的。你不能刪除這個(gè)重復(fù)的數(shù)據(jù),也不能刪除那個(gè)重復(fù)的數(shù)據(jù),你必須要認(rèn)識(shí)到刪除重復(fù)數(shù)據(jù)之后對(duì)設(shè)備性能的影響。
EMC已經(jīng)宣布了在自己的Celerra平臺(tái)上刪除重復(fù)數(shù)據(jù)的功能。NetApp使用這個(gè)功能已經(jīng)有一段時(shí)間了。其它廠商也以積極的方式增加這個(gè)功能,其方法是在數(shù)據(jù)不流動(dòng)之后對(duì)數(shù)據(jù)進(jìn)行壓縮和刪除重復(fù)數(shù)據(jù)。然后,Storwize等公司一直以在線實(shí)時(shí)壓縮的方式提供這種功能。
正如存儲(chǔ)虛擬化和精簡(jiǎn)配置已經(jīng)證明的那樣,當(dāng)你不必妥協(xié)的時(shí)候,主存儲(chǔ)將更好。為主存儲(chǔ)強(qiáng)加一些條件的問題是事情會(huì)變得更復(fù)雜。這種復(fù)雜性會(huì)導(dǎo)致人們不適用這個(gè)技術(shù)。技術(shù)越透明和越通用,取得成功的機(jī)會(huì)就越大。
一些主存儲(chǔ)優(yōu)化的挑戰(zhàn)是它基本上依賴于你擁有的數(shù)據(jù)類型和訪問那個(gè)數(shù)據(jù)的工作量。刪除重復(fù)數(shù)據(jù)要產(chǎn)生一些好處的話,顯然必須要有重復(fù)的數(shù)據(jù)。因此,每個(gè)星期進(jìn)行完整的備份是刪除重復(fù)數(shù)據(jù)的理想的應(yīng)用程序。另一方面,主存儲(chǔ)不都是重復(fù)的數(shù)據(jù)。
除了主存儲(chǔ)之外,刪除重復(fù)數(shù)據(jù)還與繁重的輸入/輸出任務(wù)和隨機(jī)的讀/寫輸入輸出有關(guān)。在這些情況下,用戶也許會(huì)感受到應(yīng)用重復(fù)數(shù)據(jù)刪除的性能影響。
因此,大多數(shù)廠商建議把這個(gè)技術(shù)的應(yīng)用限制在家目錄(home directories)和VMware鏡像方面,因?yàn)檫@些地方數(shù)據(jù)重復(fù)的可能性非常高,工作量主要是讀數(shù)據(jù)。
特別是不要在數(shù)據(jù)庫(kù)中使用刪除重復(fù)數(shù)據(jù)的功能。人們擔(dān)心,數(shù)據(jù)庫(kù)中有大量的重復(fù)的數(shù)據(jù),刪除重復(fù)的數(shù)據(jù)會(huì)對(duì)性能產(chǎn)生影響。正如我們?cè)跀?shù)據(jù)庫(kù)存儲(chǔ)優(yōu)化的文章中指出的那樣,減少甲骨文數(shù)據(jù)庫(kù)數(shù)據(jù)、聯(lián)機(jī)和實(shí)施壓縮解決方案也許更適合這里。數(shù)據(jù)庫(kù)是最適合壓縮的,無論是否有重復(fù)的數(shù)據(jù),實(shí)時(shí)的壓縮在大多數(shù)情況下都不會(huì)對(duì)性能產(chǎn)生直接的影響。
隨著數(shù)據(jù)增長(zhǎng)繼續(xù)加快,將需要更多的數(shù)據(jù)優(yōu)化。使用多種技術(shù)也許是阻止這個(gè)潮流的唯一途徑。壓縮也許會(huì)廣泛地應(yīng)用。作為應(yīng)該應(yīng)用于具體工作量的刪除重復(fù)數(shù)據(jù)的補(bǔ)充,這種刪除重復(fù)數(shù)據(jù)的做法應(yīng)該應(yīng)用于存檔,并且不在主存儲(chǔ)中使用。所有這些都需要能夠提高人員效率和資源效率的工具。
【編輯推薦】