白駒過隙,時光荏苒。2020年對于我們所有人來說都是不平凡的一年。我們見證了COVID-19疫情的肆虐,也體會了戰疫中科技的能量。不僅應對疫情,科技同時在改變著我們疫后生活、工作的方式,這其中,數據的存儲和管理,也呈現出更多的新態勢,需要我們去關注并給與及時應對。
1. (靜態和動態數據)分層安全的重要性日益提高。
超大規模軟件生態系統不斷發展,使得企業和站點在不具備基礎設施所需聯網能力的情況下,也能夠在較小的“原子單元”上開發和部署應用。越來越多的云原生應用在全球各地的聯網點或托管設施上運行。企業必須在流程的每一步對數據進行保護,在更加分布式的部署模式中妥善保護用戶靜態和動態數據。
給企業領導者的建議:在許多行業中,為防止來自內、外部的各種威脅,靜態數據加密逐漸成為強制性要求。也許今天在您所處的行業中靜態數據加密還不是一項強制性要求,但將來終歸會如此。因此,希捷建議您未雨綢繆,盡快采用加密硬盤,以確保不會造成業務中斷。
2. 企業更廣泛地采用對象存儲。
隨著數據的爆炸式增長,對象存儲開始成為大容量存儲的標配。相較于傳統的文件存儲而言,對象存儲具有諸多優勢,包括規范性元數據、可擴展性和無分層數據結構。系統得益于數據集蘊含的更高智能,而對象存儲恰能夠提供這種智能。存儲類型包括塊存儲、文件存儲和對象存儲。對于對性能十分敏感的許多任務關鍵型應用來說,塊存儲至關重要;文件存儲多年來一直服務于傳統應用,并可提供可靠的架構;而對象存儲則側重于新應用的開發,它可以與塊存儲相結合,以共生的方式提升系統規模和性能。許多傳統文件應用也在向對象存儲基礎設施遷移,以充分利用其提供的規模效益。
給企業領導者的建議:由于具備較高的經濟效率和可擴展性,對象存儲正在迅速成為事實上的大容量存儲標準,以快速補充和取代文件存儲。此外,新畢業的程序員越來越多地基于對象存儲接口來構建工作流程。我們應該多聘用這樣的人才。如果您尚未將對象存儲引入自己的數據中心,那么現在是時候采取行動了。
3. 可組合系統日益普遍。
將系統劃分為獨立單元,讓它們能夠與其他獨立單元進行組合,這并不是新想法,但是在開源的基礎上廣泛采用可組合系統才剛剛起步。Kubernetes是一個開源系統,用于自動部署、擴展和管理容器化應用,是上述發展趨勢的核心。開源是應用開發的未來,因為它能夠讓更廣泛的社區攜手解決許多行業共同面臨的挑戰,并允許通過開放式架構部署特定領域解決方案。將硬件進行組合以便更好地滿足軟件或業務需求,是一個必然的發展方向。
給企業領導者的建議:今天的數據中心正朝著可組合的方向發展,因為它可以更加輕松地部署及重新部署資源,而無需先驗配置以及計算、內存和存儲之間的靜態配置比率。容器和Kubernetes是可組合系統的核心機制,所有數據中心都應該著手采用這些技術,如果它們還沒有采用的話。
4. 分層部署大容量存儲(將熱數據放在閃存上,而所有其他數據放在硬盤上)。
英偉達GPU設計將內存劃分為不同的層級(寄存器、共享內存和全局內存),每一層有不同的屬性。寄存器延遲較低,內存較小;全局內存延遲較高,提供更大內存。英偉達提供了一個軟件界面,使用戶可以充分利用分級內存和根據該架構優化的各種解決方案。同樣,SSD和HDD也可以處于不同的層級。我們創建了太多有價值的數據,采用同構存儲策略無法提高效率。
那么分級存儲為什么重要呢?全部由高性能存儲設備組成的存儲系統成本會比預期高;而全部由大容量存儲設備組成的存儲系統性能又達不到要求。于是,分級存儲應運而生:這種方式可以在成本和性能間取得最佳平衡。隨著其他存儲技術(例如存儲級內存)的不斷出現,我們迫切需要能夠從各級存儲中提取最大價值的架構。
給企業領導者的建議:如果預算無限充足,數據中心可以全部采用成本高昂的存儲介質。然而遺憾的是,成本的現實打碎了幻想,我們不得不進行分級存儲:熱數據保存在高成本、高性能的介質上,而訪問頻率較低的數據則放在經濟實用的大容量存儲介質上。幸運的是,數據中心軟件越來越擅長識別熱數據和冷數據,并進行相應的遷移。如果您的數據中心尚未采用異構存儲介質,那么您有可能損失了存儲性能,或者付出了高昂的存儲成本。
5. 形成性人工智能提升數據的可用性。
不僅數據的創建呈爆炸式增長,有用數據量也在迅猛增長;甚至由于人工智能/機器學習(AI/ML)的進步使得用戶能夠從已經歸檔的數據中獲取更多信息,已歸檔數據也開始被激活。企業領導者必須做好準備存儲比以往任何時候都要多的數據,用于訓練各種模型,以便挖掘重要信息;同時由于數據的使用壽命有可能會延長,也要準備歸檔更多數據。形成性人工智能是一種使數據變得更具洞察性的手段。Gartner將形成性人工智能定義為“一種能夠動態變化以響應具體情況的人工智能”。IDC將形成性人工智能視為“各種新興人工智能及相關技術的總稱,它可以根據情況的變化而動態變化。”由于依賴于能夠智能地響應變化的靈活架構,形成性人工智能與分級存儲趨勢緊密相關。您在監控人工智能模型時有可能會收到信號說它發生了偏離。此時,您可以使用另外一個模型在硬盤層上搜索適當的訓練數據,并將這些數據自動移動到閃存層,以加快訓練速度。硬盤層也可能是對象存儲,因此也與對象存儲發展趨勢有關。其優點既在于速度(因為數據會自動移動到快速存儲層),也在于成本(因為您可以將數據以易于訪問的形式存儲在高性價比的硬盤上,以備需要時調用)。