軟件定義存儲(SDS)之入門
在互聯網、物聯網、大數據的伴隨下,數據呈指數增長,每天增加百萬兆字節的數據是很常見的,隨之而來將會面臨的是更多的存儲需求和挑戰。傳統的解決方案不足以滿足這些存儲需求,迫切需要一種有效的解決方案,軟件定義存儲是解決這些問題的常用方案。
SDS起源
在IT基礎架構領域的軟件定義,最早出現的是:軟件定義網絡(SDN)。SDN起源于2006年斯坦福大學的Clean Slate研究課題。2009年,Mckeown教授正式提出了SDN概念。通過將網絡設備的控制平面與數據平面分離開來,并實現可編程化控制,實現了網絡流量的靈活控制,為核心網絡及應用的創新提供了良好的平臺。
2012年,VMware在其vForum大會上***提出軟件定義數據中心(SDDC)的概念。作為VMware軟件定義數據中心五大組成部分(計算、存儲、網絡、管理和安全)之一,軟件定義存儲(SDS)的概念也***被提出。
EMC公司在當年的EMC World發布大會上也發布了SDS戰略,引發了業界對SDS的大討論,SDS迅速成為存儲業界的研究熱點。而SDS的概念則是最近幾年隨著華為、杉巖數據等企業產品的逐漸成熟而興起的。
SDS是個啥?
2012年8月,VMware***提出軟件定義存儲的概念。VMware認為軟件定義的存儲產品是一個將硬件抽象化的解決方案,它使你可以輕松地將所有資源池化并通過一個友好的用戶界面(UI)或API來提供給消費者。一個軟件定義的存儲的解決方案使得你可以在不增加任何工作量的情況下進行縱向擴展(Scale-Up)或橫向擴展(Scale-Out)。
實際上,SDS的定義出現至今已經三年多了,但仍沒有統一的標準。貢獻***的SNIA認為SDS允許異構的或者專有的平臺。必須滿足的是,這個平臺能夠提供部署和管理其虛擬存儲空間的自助服務接口。除此之外,SDS應該包括:
- 自動化:簡化管理,降低維護存儲架構的成本;
- 標準接口:提供應用編程接口,用于管理、部署和維護存儲設備和存儲服務;
- 虛擬數據路徑:提供塊、文件和對象的接口,支持應用通過這些接口寫入數據;
- 擴展性:無需中斷應用,也能提供可靠性和性能的無縫擴展;
- 透明性:提供存儲消費者對存儲使用狀況及成本的監控和管理。
SNIA認為,存儲服務的接口需要允許數據擁有者(存儲用戶)同時表達,對于數據和所需服務水準的需求。數據的需求,就是SDS建立在數據路徑(Data Path)的虛擬化,而控制路徑(Control Path)也需要被抽象化成為存儲服務。云、數據中心和存儲系統,或者數據管理員能夠被用于部署這個服務(指Control Path)。
SDS對于初學者需要注意啥?
盡管SDS概念很簡單,但過渡到技術既復雜又具有挑戰性。隨著自動化,靈活性,存儲容量的增加和提高工作效率的綜合誘惑,SDS已變為主流,銀行,制造,制藥,醫療保健,媒體和政府等企業迅速轉向該技術。
1. 入門
成功的SDS用戶首先會選擇離散用例作為起點。在企業內部,通常將備份和歸檔等第2層應用程序視為存儲大規模任務關鍵型數據的***方式,這些是展示SDS的可擴展性,可用性和成本優勢的***方式。隨著時間的推移,更多的用例包括大數據和深度學習可以上線,進一步提高SDS的經濟優勢。
最近轉向超融合基礎設施(HCI)的企業已經開始使用SDS,對于這些公司來說,首先評估一下HCI是否對公司有益這是一個很好開端。如果HCI對公司有益,就要考慮是否需要擴大數據中心的SDS覆蓋范圍。即使沒有采用HCI的公司通常也已在他們的環境中使用了某種類型的虛擬化技術。
VMware,HyperV實際上是軟件定義的計算解決方案,軟件定義的存儲產品將虛擬化優勢擴展到數據層,但采用者還需要仔細檢查是否支持基礎架構。任何企業,當他們進入下一個基礎架構更新周期時,都應該需要評估更新的技術所帶來的風險。
找到能夠滿足當前和未來存儲要求的SDS產品非常重要,特別是在合規性和安全性等關鍵領域。要區別對待并找到一種能夠降低IT部門復雜性和任務的解決方案,然后開始遷移最容易遷移的工作負載,或者是具有當前未滿足特殊要求的數據集,例如加密,性能或可訪問性。企業應該評估他們未來幾年的技術路線圖,并考慮轉向SDS解決方案,如果現有環境需要新的存儲管理員,那么可能考慮雇用精通軟件定義存儲的新系統管理員。
2. 潛在陷阱
企業在計劃向SDS轉型時經常會犯的一個錯誤是將技術看作是“點產品”。VMware副總裁Lee Caswell說:“軟件定義的解決方案是一個更大的堆棧的理想組成部分,它為計算、存儲、網絡和云提供了一個通用的操作模型。“
對于企業和從事SDS的技術人員來說,***的問題可能是操之過急。一些企業會后悔他們的決定,因為要么過于突然,要么事前沒有適當的規劃。那些沒有適當技能的人會感到沮喪,或許他們會覺得任何存儲管理員或云的從業者都能在一夜之間掌握這些知識和培訓。
SDS新手犯的***錯誤也許是相信這項技術對所有工作負載來說都是“萬靈丹”。所有的企業都可以從大量的工作負載中受益,但真正重要的還是利用可用的it資源來分析業務需求,從而提出操作的***解決方案。
SDS應用場景
多年前,麥當勞希望可以通過問卷的方式從消費者口得知“要怎么改進奶昔,你才會買更多?你想要這款奶昔再便宜點嗎?巧克力味再多點怎么樣?”等問題答案。于是,麥當勞請了哈佛商學院教授 Clayton Christensen 和他的團隊一起解決這個問題。后來發現原來所有買奶昔的顧客每天一大早都要開很久的車去上班,路上很無聊,開車時就需要做些事情讓路程變得有意思一點;其次就是防止午飯前肚子咕咕叫。那么,在這個場景下,奶昔的作用就發揮出來了
同樣在對于軟件定義的存儲,我們也會好奇它在什么場景下適用呢。
- VDI場景,目前最被人接受的場景,傳統虛擬桌面環境(VDI)的共享存儲,在進行擴展的時,需要增添服務器和存儲陣列;而采用SDS作為VDI存儲的時候,可與虛擬化平臺進行融合部署,僅需要擴展服務器,依靠服務器內的本地存儲來增加虛擬共享存儲容量。可以說,VDI的存儲包含在單獨的服務器里,縱向可以通過添加磁盤進行擴展,橫向可以通過增加新的服務器節點。
- 私有云場景,在這個場景中,軟件定義存儲可與同樣基于軟件定義的計算、網絡進行深度融合于一體,軟件定義存儲的大容量、高安全性、高擴展性、性能線性增長等特性簡直***貼合私有云需要的存儲特性。
- 企業內部開發測試場景,對于企業的開發測試環境、學習實驗環境、云計算數據中心,分布式存儲技術同樣受用。比如,OLAP(聯機分析處理)和OLTP(聯機事物處理)。在具體工作中,通過分布式客戶端緩存,降低存儲時延,滿足OLTP需求,亦可滿足OLAP所要求的大并發MBPS,高計算和存儲帶寬、高IOPS并發的要求。
- 數據高可用需求場景,就像有人天生就是靠臉吃飯一樣,有些業務天生就需要分布式的。軟件定義存儲天然可以將數據進行切分然后松耦合運行,采用無中心節點的設計,將數據進行切分以多副本的形式存放在不同的硬盤、節點、機架上,即使某個節點出現故障,業務也可以正常運行,進而保證數據的高可用性。
- 數據備份場景借助軟件定義存儲自身的分布式特點,可獨立或與備份軟件相配合,為生產系統的主用存儲提供更為安全的數據備份服務。
以上的場景只是目前已經被驗證的場景,但是相信,隨著科學技術的發展,軟件定義的存儲應用場景不僅僅止于這些。
SDS面臨的挑戰
軟件定義存儲從國內外的預測來看,在2020年左右也會迎來比較大的發展期。致力于信息技術研究和分析的公司Gartner預測,2020年企業的采納率會達到35%,其中文件存儲應用占比較大的份額,塊存儲和對象存儲緊隨其后。
我國軟件定義的存儲市場也在蓬勃發展,新興市場驅動著大批企業進一步推動產業發展。“雖然SDS增長勢頭強勁,但仍存在一些問題。”栗蔚表示。
就中國市場而言,目前的挑戰主要在于首先統一管理和調度的問題,很多用戶數據中心的存儲是萬國俱樂部對此,業界針對性推出了存儲虛擬化的解決方案,如ViPR、SVC等,基本上就是這樣目的。在沒有軟件定義存儲的時代,都提存儲虛擬化。以至于后來,軟件定義存儲出現之后,很多認為不過存儲虛擬化的翻版,舊瓶裝新酒。
其次還有一個需求就是存儲的軟件和硬件分離,從緊耦合到松耦合,讓軟件和硬件無關。其帶來的好處在于,讓應用融合變得更加簡單。以SAN和 NAS為例,很多用戶希望一臺設備同時提供SAN、NAS的需求,所謂統一存儲。如果軟件和硬件不分離,就需要額外增加NAS網關。 隨著對象存儲應用需求的出現,軟件定義存儲會讓應用的支持變得簡單,靈活。應該說,這是軟件定義存儲主要解決的問題。