NASvs.對象存儲:什么是非結構化數據存儲的優秀選擇?
?將NAS或對象存儲用于非結構化數據各有利弊。了解在可擴展性、性能和工作負載類型方面需要考慮的事項。
非結構化數據是增長最快的數據類型之一。隨著組織創建并嘗試存儲逐年增加的數據量,這自然會引發一個問題:非結構化數據的最佳存儲是什么?
非結構化數據是不符合傳統數據庫格式的信息。電子郵件和文檔形式的文本以及多媒體(例如照片、視頻和音頻文件)是非結構化數據的常見示例。在尋找存儲非結構化數據的優秀方式時,NAS與對象存儲是兩個主要選擇。
NAS與對象存儲
NAS已經存在了幾十年,它在用戶和他們的文件之間放置了一個目錄和文件夾的分層系統。這種方法使組織能夠巧妙地對單個文件進行分類以供以后使用。
另一方面,對象存儲不會對數據強加文件系統范式。相反,對象系統使用與底層數據元素分開存在的元數據表。元數據表存儲描述基礎數據的屬性,例如文件名、創建日期、用戶ID和可以從中檢索數據的位置。
數據存儲管理:它是什么以及為什么它很重要?
這兩種方法各有利弊,尤其是在非結構化數據存儲的情況下。而且,在NAS與對象存儲的爭論中,適合您組織的存儲類型還取決于支持的工作負載類型。
優點和缺點
使用NAS進行非結構化數據存儲的主要優勢在于它是有組織的,至少在您創建一個體面的文件夾結構的情況下,它是用戶友好的。NAS也無處不在,有許多支持NFS或SMB存儲的服務。此外,它相對較快,并為數據快速變化的應用程序提供支持。
另一方面,可擴展性并不是NAS的強項。隨著功能更強大的橫向擴展產品的出現,這種情況正在發生變化,但NAS仍然沒有接近對象存儲系統固有的可擴展性潛力。
對象、文件和塊存儲比較
事實上,規模是對象存儲系統的最大好處。增加容量是一項簡單的練習,一旦超出了添加硬件的范圍,它就幾乎看不見了。原因:許多對象存儲系統向外擴展而不是向上擴展。您所要做的就是添加另一個節點,然后告訴管理工具將新節點添加到集群中。幕后發生了一些神奇的事情,集群現在擁有更多的存儲容量。
性能是傳統對象存儲的挑戰。但是,隨著更新的對象存儲產品,這種情況也在發生變化。對象存儲的另一個缺點是元數據和對象數據都必須更新。因此,如果您擁有快速變化的數據,則該過程可能需要比NAS更長的時間。此外,盡管存在網關和一些標準化的訪問協議,例如AmazonS3,但對象存儲標準并不像它們基于文件的表親那樣一致。
NAS和對象存儲系統的特點
盡管文件和對象存儲在邏輯級別上是截然不同的方法,但實際的存儲子系統可以共享大量特性和功能。企業用戶可以考慮一系列NAS或對象功能,例如:
- 數據分層和放置。NAS和對象存儲系統可以使用文件標記和對象元數據策略將數據組織成層——將更重要或經常訪問的數據放入更快的存儲中,同時將不太關鍵的數據降級到成本較低的近線磁盤。
- 全局命名空間。創建“命名空間”從相應的應用程序中抽象出存儲,使應用程序能夠在任何合適的NAS或對象存儲系統上查找和訪問數據,作為無縫存儲可擴展性的關鍵手段。
- 高性能和多租戶。存儲系統必須能夠同時處理用戶或應用程序,而不會引入可能導致應用程序延遲或錯誤的延遲。這需要內部處理能力——通常具有并行訪問磁盤的能力——以及合適的網絡帶寬。
- 數據保護。考慮NAS或對象存儲設備的數據彈性功能,例如RAID、復制或分布式/集群存儲方法。數據保護消除了任何單點故障——導致數據丟失——并且可以成為業務連續性和合規性的關鍵部分。
- 靈活的訪問。NAS和對象存儲系統可以提供各種訪問數據的方式,例如表示狀態傳輸(REST)或實體對象訪問協議(SOAP)API,以及合適的存儲協議,包括用于文件存儲的CIFS和NFS,用于存儲的Lustre或PanFS對象存儲,如果存儲系統支持大數據分析,甚至是Hadoop分布式文件系統。
- 管理選項。NAS和對象存儲系統管理可以包括多種功能,包括自我配置、自動修復和自動重新平衡(即文件重定位以分散磁盤訪問)功能。
- 云界面。一些文件和對象存儲系統可以提供可以支持私有云或與公共云存儲產品互操作的云接口,以構建無縫的云/本地存儲基礎設施。
企業中的NAS和對象用例
NAS和對象存儲具有相同的基本目的:為企業用戶和應用程序存儲數據。但是這兩種技術的優點和缺點使它們各自適合不同的用途。
NAS提供了一種更傳統的數據存儲方法,非常適合各種任務,包括必須存儲或訪問文件數據的任何地方,例如:
- 流式傳輸或檢索任何形式的媒體——例如圖像、視頻、音頻和文本——表示為文件而不是非結構化對象;
- 存儲用于分析的原始數據文件;
- 存儲數據備份或使用NAS作為文件復制目標;
- 運行一系列開源業務應用程序,例如SugarCRM、VtigerCRM、Orange HRM、Synology Office、Mattermost(聊天),甚至各種電子郵件服務器、Web服務器和內容管理系統(如WordPress)——幾乎任何業務應用程序都會阻止-不需要基于SAN的存儲;
- 存儲、訪問和托管虛擬機;
- 使用NAS在私有云中提供文件存儲,通常通過NAS制造商的基于瀏覽器的UI;
- 將NAS存儲用于測試和開發任務,例如基于Web或基于服務器的應用程序。
對象存儲也存儲數據。但是對象的扁平(非分層)、非結構化、基于元數據的性質使得對象存儲對企業中的各種存儲應用程序具有吸引力,包括:
- 流式傳輸或檢索任何形式的媒體——例如圖像、視頻、音頻和文本——表示為非結構化對象而不是傳統文件;
- 存儲用于分析的數據,其中對象可以是非常大的數據庫,因為對象存儲通常是龐大且高度可擴展的存儲設施的基礎,例如數據倉庫甚至數據湖部署;和
- 存儲數據備份,因為對象存儲通常是復制或分布式的,因此對象存儲對于僅需要不頻繁訪問的任務(例如DR、備份和長期歸檔存儲)具有高度彈性。
云中的NAS和對象存儲
隨著越來越多的用戶和應用程序使用公共云,提供商正在提供一系列存儲服務,旨在模擬文件和對象——以及塊和特定于應用程序的——存儲資源,可以提供全球可訪問性、高持久性和高彈性。
NAS。基于文件的存儲服務包括:
- 亞馬遜EFS
- Azure文件
- Google文件存儲
對象。基于對象的存儲服務包括:
- 亞馬遜S3
- AzureBlob
- 谷歌云存儲
剛開始使用公共云服務、開發混合云基礎架構或需要持續的本地存儲需求的組織可能會考慮選擇與公共云兼容的存儲系統。
硬件/云兼容性的關鍵通常在于存儲系統的操作系統平臺。例如,Cohesity SmartFiles支持各種Amazon服務,包括S3、GovCloud、Snowball、EFS、FSxfor Windows FileServer和Amazon FSxfor NetApp ONTAP。另一個例子是,NetApp ONTAP9等NetApp平臺支持Google Cloud Storage。
必須根據存儲容量、外形尺寸(塔式或機架式)、網絡和I/O性能、彈性特性和可擴展性等因素的要求仔細選擇存儲系統。
非結構化數據存儲的底線
那么,在NAS與對象存儲方面,哪種方法更勝一籌?一般來說,如果應用程序包含快速變化的數據和簡化的訪問,NAS可能是最佳選擇。如果工作負載的存儲更像是存檔,并且不需要與應用程序進行非常高水平的本機集成,那么對象存儲就是選擇。
規模也在NAS與對象存儲決策中發揮作用。NAS系統的擴展范圍差異很大,因此在某些時候,可能會超出選擇的NAS產品的限制。?