如何創(chuàng)建有效的數(shù)據(jù)歸檔策略
組織選擇正確的數(shù)據(jù)存檔策略可以通過(guò)多種方式獲益,以下是如何做到這一點(diǎn)的提示。
存儲(chǔ)廠商StorageSwiss公司前任首席分析師、StorONE公司現(xiàn)任首席營(yíng)銷官George Crump表示,盡管數(shù)據(jù)歸檔對(duì)于大多數(shù)組織非常重要,但并非所有組織都擁有數(shù)據(jù)檔案。其原因有很多:決策者可能不了解歸檔的價(jià)值,也不了解備份與歸檔之間的區(qū)別,歸檔可能過(guò)于復(fù)雜,也可能被認(rèn)為成本過(guò)高。
他指出,任何一家擁有超過(guò)25TB數(shù)據(jù)的企業(yè)都需要制定數(shù)據(jù)歸檔策略。
Crump說(shuō),“這并不是組織為了在主存儲(chǔ)方面節(jié)省成本,而是因?yàn)楸仨毮軌蜃C明其數(shù)據(jù)保留,而且隨著通用數(shù)據(jù)保護(hù)條例(GDPR)和加州消費(fèi)者隱私法(CCPA)等法規(guī)的生效,這一點(diǎn)將變得越來(lái)越重要。”
數(shù)據(jù)歸檔還有其他好處,其中包括歸檔數(shù)據(jù)通常存儲(chǔ)在成本較低的存儲(chǔ)層上。另外,數(shù)據(jù)歸檔有助于防止數(shù)據(jù)丟失。
另一個(gè)原因是免受勒索軟件的侵害。通常來(lái)說(shuō),這是因?yàn)闅w檔數(shù)據(jù)更難訪問(wèn)。例如,一家組織將其500TB數(shù)據(jù)中的300TB存檔之后卻遭到了勒索軟件攻擊,而其存檔的300TB數(shù)據(jù)沒(méi)有受到損害。
數(shù)據(jù)歸檔還可以使實(shí)時(shí)數(shù)據(jù)集規(guī)模更小,從而使其更容易、更快捷地進(jìn)行處理。例如,如果組織通常只搜索前一年執(zhí)行的交易,那么在實(shí)時(shí)存儲(chǔ)系統(tǒng)中保留10年的交易價(jià)值將使其速度變慢并且花費(fèi)更多成本。
以下是創(chuàng)建適合組織業(yè)務(wù)的數(shù)據(jù)存檔策略的一些技巧:
(1)組織知道自己擁有的數(shù)據(jù)。組織在歸檔任何內(nèi)容之前,必須知道擁有哪些數(shù)據(jù)。有很多工具可以幫助完成此任務(wù),但是許多工具都依賴于平臺(tái)。例如,如果組織運(yùn)營(yíng)Windows文件服務(wù)器,則它可能需要采用與NetApp設(shè)備不同的工具。但是也有一些不可知的工具,其中包括SolarWinds和Clear Technologies的工具。
(2)在做事之前仔細(xì)考慮。在購(gòu)買任何東西之前,需要了解誰(shuí)將使用它,將要?dú)w檔哪些數(shù)據(jù)、數(shù)據(jù)訪問(wèn)頻率以及如何更新、訪問(wèn)和控制歸檔。
技術(shù)研究和咨詢機(jī)構(gòu)ISG公司首席顧問(wèn)Cindy LaChapelle說(shuō),確定數(shù)據(jù)的訪問(wèn)頻率至關(guān)重要,因?yàn)檫@可能決定組織選擇的平臺(tái)類型和所需的響應(yīng)時(shí)間。
她解釋說(shuō):“如果存檔在云平臺(tái)中運(yùn)行,但是所有數(shù)據(jù)的原始副本都存儲(chǔ)在數(shù)據(jù)中心中,然后再調(diào)用這個(gè)基于云計(jì)算的數(shù)據(jù)歸檔,則可能需要擔(dān)心延遲問(wèn)題。因此,有很多技術(shù)參數(shù)需要根據(jù)誰(shuí)將訪問(wèn)數(shù)據(jù)、恢復(fù)數(shù)據(jù)的頻率和要求來(lái)測(cè)試。”
(3)根據(jù)所有增長(zhǎng)中的數(shù)據(jù)必須保留在實(shí)時(shí)系統(tǒng)中的時(shí)間,為其分配保留時(shí)間表。澳大利亞Rapidap公司技術(shù)服務(wù)總監(jiān)Gi Singh解釋說(shuō),“例如,如果使用信用卡為交易支付費(fèi)用,則應(yīng)根據(jù)客戶可以在多長(zhǎng)時(shí)間之后對(duì)費(fèi)用提出異議,并增加一些應(yīng)急措施。”
他補(bǔ)充說(shuō),在確定保留時(shí)間表時(shí)不要進(jìn)行假設(shè)。取而代之的是,與組織各個(gè)領(lǐng)域的數(shù)據(jù)用戶溝通,以制定保留時(shí)間表,并在實(shí)施之前獲得他們的批準(zhǔn)。
例如,營(yíng)銷團(tuán)隊(duì)可能有圖像、視頻和音頻要存檔,但是只有營(yíng)銷團(tuán)隊(duì)才能知道它需要多長(zhǎng)時(shí)間才能恢復(fù)這個(gè)存儲(chǔ)媒介,以及該媒介在存檔之前應(yīng)可供其部門使用多長(zhǎng)時(shí)間。因此,IT團(tuán)隊(duì)必須與市場(chǎng)團(tuán)隊(duì)一起創(chuàng)建技術(shù)解決方案。組織的其他團(tuán)隊(duì)也是如此,例如法務(wù)和財(cái)務(wù)等部門。
(4)選擇適合的軟件。涉及數(shù)據(jù)歸檔時(shí)有三個(gè)基本選項(xiàng):組織可以自己完成開(kāi)發(fā),使用可以為其標(biāo)識(shí)和移動(dòng)數(shù)據(jù)的軟件,或者使用可以標(biāo)識(shí)和移動(dòng)數(shù)據(jù)并建立指向其數(shù)據(jù)鏈接的軟件。
- 自己開(kāi)發(fā):使用這種方法,組織的IT員工可以使用PowerShell或Python腳本開(kāi)發(fā)數(shù)據(jù)庫(kù)。然后只需確定數(shù)據(jù)并發(fā)出移動(dòng)命令,當(dāng)然要確保首先備份數(shù)據(jù)。
- 中間路線:使用軟件解決方案來(lái)分析整個(gè)環(huán)境中的數(shù)據(jù),并根據(jù)組織的策略和要求為其自動(dòng)識(shí)別和移動(dòng)數(shù)據(jù)。
- 完整方案:這些解決方案可以完成所有工作,自動(dòng)識(shí)別和移動(dòng)數(shù)據(jù),并在需要時(shí)包括自動(dòng)召回。這意味著可以將文件或云平臺(tái)中的文件或?qū)ο笾匦略L問(wèn)存檔的數(shù)據(jù)。這使恢復(fù)非常簡(jiǎn)單。
組織選擇的選項(xiàng)取決于許多因素,其中包括IT專業(yè)人員的技能、花費(fèi)的費(fèi)用以及所需的功能。
Crump說(shuō):“隨著這些類別的增加,其成本變得越來(lái)越昂貴,并且從設(shè)計(jì)的角度來(lái)看變得越來(lái)越復(fù)雜。因此,如果企業(yè)具備編寫腳本的技能,那么人工方法就很有吸引力。否則,他們必須在第二種方法和第三種方法之間做出選擇。”
在這兩種自動(dòng)方法之間選擇取決于組織真正希望多久調(diào)用一次數(shù)據(jù),這很難弄清楚。Crump說(shuō),他建議組織每隔一個(gè)月將其數(shù)據(jù)快照進(jìn)行比較。
組織需要確定其人工操作的費(fèi)用。一般來(lái)說(shuō),人工操作環(huán)節(jié)越多,費(fèi)用就越多。
Crump說(shuō),“我已經(jīng)看到很多組織決定從人工操作方法開(kāi)始,如果需要完成更多工作,他們將轉(zhuǎn)向采用自動(dòng)化的解決方案。這是一個(gè)很好的策略。”
組織對(duì)購(gòu)買的存儲(chǔ)容量需要具有策略性的考慮,因?yàn)椴恍枰少?gòu)過(guò)多的存儲(chǔ)容量。例如,如果組織中有500TB的數(shù)據(jù),則分析可能會(huì)表明,其中300TB的數(shù)據(jù)已超過(guò)一年未被訪問(wèn)。當(dāng)一個(gè)需要50TB存儲(chǔ)空間的項(xiàng)目啟動(dòng)時(shí),只需將存儲(chǔ)時(shí)間最久的50TB數(shù)據(jù)移動(dòng)到存檔中,即可釋放所需的容量,而無(wú)需花費(fèi)更多的費(fèi)用。
組織需要經(jīng)常重新審視歸檔策略。保留策略、業(yè)務(wù)優(yōu)先級(jí)、安全問(wèn)題、政府法規(guī)和技術(shù)經(jīng)常發(fā)生變化,而且組織的數(shù)據(jù)歸檔策略應(yīng)該與時(shí)俱進(jìn)。
LaChapelle說(shuō):“如果一個(gè)組織在多年前創(chuàng)建了數(shù)據(jù)檔案,它甚至可能沒(méi)有關(guān)于數(shù)據(jù)的保留策略。但是如今,有關(guān)于在特定時(shí)間范圍內(nèi)刪除個(gè)人數(shù)據(jù)的法規(guī)。這可能會(huì)影響存檔中的許多數(shù)據(jù)集,如果從一開(kāi)始就沒(méi)有對(duì)它進(jìn)行分類,則可能必須對(duì)存檔數(shù)據(jù)進(jìn)行一些重新分類。”
Singh表示,組織在評(píng)估當(dāng)前的數(shù)據(jù)歸檔策略時(shí),一定要問(wèn)自己這些問(wèn)題:
- 數(shù)據(jù)安全嗎?
- 存檔數(shù)據(jù)是否持久?
- 如果業(yè)務(wù)需要,是否可以訪問(wèn)或恢復(fù)?
- 系統(tǒng)或用例是否已更改?
- 合規(guī)要求是否已更改?
- 成本是否發(fā)生變化?例如,現(xiàn)在在云平臺(tái)中歸檔的成本是否比在內(nèi)部歸檔的成本更低?成本在未來(lái)幾年將會(huì)發(fā)生什么變化?
- 文檔是否是最新的?
創(chuàng)建數(shù)據(jù)歸檔策略不必過(guò)于昂貴或復(fù)雜,而數(shù)據(jù)歸檔在合規(guī)性和安全性的回報(bào)是值得的。