判斷超融合存儲優劣的幾個原則初探(1)
互聯網+戰略的實施,讓分布式存儲受到了***的關注。與傳統存儲相比,分布式存儲橫向擴展的能力備受傳統企業青睞,它能夠讓企業更加敏捷、靈活,能夠滿足了企業業務快速發展的需要,特別是在成本節省上,分布式存儲優勢明顯,加上互聯網企業的成功實踐,這都為傳統企業轉型提供了新的思路。
如今,以超融合為代表的分布式存儲發展迅速,國內外提供超融合產品解決方案的廠商眾多,如VMware VSAN、EVO:RAIL、EMC ScaleIO、Nutanix、Maxta、SimpliVity、Scale Computing、Pivot3、Stratoscale、Gridstore、Atlantis Computing、華三、達沃時代、華為FusionStorage 、SMARTX、深信服、華云網際、凱翔科技等都提供了各種不同的分布式存儲產品和方案。
在對外宣傳上,各家廠商稱謂也不相同,從超融合、分布式存儲、融合存儲、到ServerSAN、云存儲、軟件定義存儲,總之五花八門,讓人眼花繚亂,總之一句話:都是將存儲管理軟件安裝在多臺x86存儲服務器上,管理存儲資源,并讓服務器協調合作,對外呈現出統一的存儲接口。如果根據存儲接口不同,又可以細分為對象存儲(Key-Value Store)、Server SAN(分布式塊設備),NoSQL數據庫存儲等。
在我看來,其實不必糾結稱謂和定義。從應用的角度出發,它提供了有別于傳統存儲的新的選擇,用戶可以根據自己的業務需要進行判斷和選擇。
對于新的存儲系統而言,由于技術較新,用戶了解有限,因此市場產品魚目混珠、濫竽充數是在所難免的。在這種情況下,用戶應該如何選擇適合的產品呢?本文中,我將從技術的角度談談個人的看法,以饗讀者。
在我看來,評價一個分布式存儲系統的優劣可以從性能(Performance)、可擴展性(Scalability)、系統可用性(Availability)和數據安全性(Data Reliability即數據不丟失)4個方面加以看量。
一個總的結論是***的產品是不存在的,即沒有一個產品能同時確保四個方面都很突出。因為這四個方面在一定程度上是互相矛盾的,例如數據安全性越高,需要的數據備份數量就越多,但與此同時,系統性能就會降低。比如兩副本系統的數據安全性,通常會低于3副本系統,但是系統的讀寫性能,2副本通常高于3副本。因此優秀的分布式存儲系統是需要根據產品本身的對外特性,在上述4個方面進行合理的取舍。
通常說來, ServerSAN產品對系統性能(IOPS)要求比較高,勢必會犧牲一定的數據安全性;而對象存儲產品不得不犧牲一定的IOPS或讀寫的延遲,來換取對象存儲所需要的數據高可靠性。
在本文所推薦的幾個原則,是透過ServerSAN產品體系架構的分析,來判斷和比較產品的優劣。除了技術分析之外,盡可能為大家提供一些簡單的判斷方法,希望能夠有所幫助。
首先是通過塊數據存取方法來判斷系統的性能和效率。
眾所周知,ServerSAN主要處理塊數據,以計算虛擬化、數據庫等應用為主,更多涉及企業的OLTP業務應用,大多屬于關鍵業務應用。對于這類業務應用而言,系統的可靠性、安全性至關重要。在滿足了這些條件的前提下,性能將是最終決定因素,這也是產品之間來開差距的指標。
如果僅僅從現有應用著眼,會有用戶對于性能的效率和能力不以為意,但從長遠的發展眼光,塊數據存取方法的不同,技術設計架構的差異,所表現出的能力會有較大的區分。
目前ServerSAN系統存取塊數據,對于存儲介質的訪問存在直接和間接的訪問方式的區分。所謂間接的訪問方式,就是借助ext2、ext3、ext4或者ZFS等Linux的文件系統,來存儲和管理塊數據,或者利用對象存儲系統將塊數據以對象的方式存取。
這種數據訪問方式實現起來相對簡單,但它們無法針對塊數據的特點,以及設備的特性進行性能優化,訪問過程中需要對用戶的塊數據進行多次轉換,比如將塊數據傳遞給文件系統,由文件系統再將數據寫入存儲介質。這種多層次的傳遞會造成系統性能損耗。
用對象存儲來實現塊設備存儲存在更多問題,因為對象存儲中的對象通常是Immutable(不可改變的),而且對象存儲系統更加強調吞吐率,而塊設備中的數據是在不停的被修改的,并且塊設備更強調IOPS。因此,間接的訪問存儲介質的方式其性能很難達到***。
與之相比,直接存儲方式會自己實現一個適合塊設備特性的精簡文件系統,直接對磁盤裸設備(Raw Device)直接操作和控制,可以在***程度上充分利用磁盤設備的IOPS,從而達到系統硬件的極限。
既然存在這樣的區分,因此對于用戶來說,很重要的一個任務就是能夠識別出哪些才是專業的九段產品,避免業余九段渾水摸魚。但在工作實踐的過程中,有什么樣的方法能夠幫助我們進行鑒別呢?
在此,個人給大家推薦的辦法是:就看ServerSAN系統管理的存儲介質上,是否安裝了文件系統。如果存儲介質上有文件系統,那么便是間接訪問方式。這種鑒別方法未必100%準確,但絕大多數情況下是有效的。
總之,用戶對于系統存儲介質的訪問方式需要保持高度的重視。(未完待續)
作者簡介:陳靚,1999年北京航空航天大學碩士畢業,2002年考入美國俄亥俄州立大學學習計算機科學,2006年獲得該校博士學位。此后入職美國Amazon,于AWS Storage Team(云計算核心存儲團隊)工作,長達7年之久,曾經擔任系統架構師和研發團隊帶頭人,負責設計和實現了著名的AWS Glacier系統結構;2011年加入AWS S3團隊,負責對AWS S3 的Volume子系統新版本的研發。2013年,接受南京市政府321計劃的感召,選擇歸國創業,創辦了南京鵬云網絡科技有限公司,致力于私有云存儲產品的研發。2015年入選中組部“國家千人計劃”專家人才。