集群NAS和對象存儲的區別
這個話題乍一看可能有些奇怪,因為一個是集群NAS存儲,一個是對象存儲,沒什么相同的地方,為啥還要比較?
而實際上,在考察兩種技術的實際應用場景時,我們會發現,兩種技術都是用來存儲海量的文件。而既然都是存儲大量文件的,那什么情況下使用哪種技術,很多人又很難一時間區分清楚。
因此,木友在做木工的閑暇之余,總結比較了兩種技術,做了一個學習筆記,談一下二者的區別,分享給各位讀者。
首先,我們先來復習一下兩種技術的定義
以下英文內容節選自維基百科。
對NAS和集群NAS 的描述:
“Network-attached storage (NAS) is afile-level computer data storage server connected to a computer networkproviding data access to a heterogeneous group of clients.”
“NAS provides both storage and a filesystem.”
“A clustered NAS is a NAS that is using adistributed file system running simultaneously on multiple servers.”
簡單總結,集群NAS符合以下幾個特征:
- 結構:存儲和文件系統。文件系統運行在NAS自身(這同時也是NAS和SAN的本質區別)。
- 分布式:文件系統為分布式文件系統(有時也叫作集群文件系統),數據和元數據分散分布在多個節點上。
- 并行訪問服務:對多個客戶端并行提供文件共享服務。
- 存儲數據類型:主要是文件等非結構化數據
- 數據保護方式:底層采用傳統RAID技術居多,多為RAID-6,最多容忍兩塊硬盤(或節點)失效。也有部分技術采用多份副本方式,但保護程度接近。
- 容災:可實現容災等遠程數據保護。
對象存儲的描述:
“Object storage is a storage architecturethat manages data as objects, as opposed to other storage architectures likefile systems which manage data as a file hierarchy and block storage whichmanages data as blocks within sectors and tracks. Each object typicallyincludes the data itself, a variable amount of metadata, and a globally uniqueidentifier. “
“Some high-performance distributed filesystems use an object-based architecture, where file metadata is stored inmetadata servers and file data is stored in object storage servers.”
“In 2013, IDC rated Cleversafe, Scality,DataDirect Networks, Amplidata, and EMC as leaders.”
簡單總結下對象存儲符合以下幾個特征:
- 結構:將數據像對象一樣管理,可以理解為單層目錄。
- 每個對象包含:數據,元數據,全局***標識號。
- 分布式:數據分布式(甚至是跨地域)存放,有些分布式文件系統可以提供對象存儲和訪問功能。
- 數據保護方式:采用糾刪碼(Erasure Code)等技術,N+M場景下,可容忍M個節點物理損壞。當然M值越大,容量與性能開銷都越大。
- 容災:可實現對象級別的容災。
同時,為了簡明扼要,作者做了一個比較列表來總結一些主要特性對比。
對比之后,木友對于應用場景的個人觀點如下,讀者如有異議,可以發信與小編一起來探討。
集群NAS性能和擴展性好,但價格較高,一般運行在一個數據中心內。所以適合客戶自建數據中心內需要高帶寬、大容量的業務。如高性能計算、流媒體等。
對象存儲擴展性好,價格較低,但性能一般,可以跨中心運行,所以適合在公有云環境中作為一類存儲服務來提供,或者適合大型客戶在自建私有云環境中提供多租戶的大容量存儲服務,目前看到的對象存儲的部署級別都是在PB級起步。此外由于對象存儲對讀訪問的支持要好于寫訪問,因此對象存儲更適合于“冷數據“的存放。
同時需要指出,兩類技術會有重疊之處,例如有些分布式文件系統可以同時支持集群NAS和對象存儲。而現在有些較為先進的對象存儲產品也開始支持集群NAS功能,以實現和用戶已有應用的集成。
從長遠來看,兩類技術都將會有用武之地。由于對象存儲處于一個上升的生命周期,可以預見會有更多對性能不太敏感的業務遷移到對象存儲。