超融合架構:主數(shù)據(jù)存儲使命之外
在主站點上實現(xiàn)的數(shù)據(jù)存儲與工作負載廣為人知——而與之對應二級站點則并非如此。也正因此,近年以來二級站點相比主站點,在體系結構方面發(fā)展甚緩。
按照慣例,數(shù)據(jù)存儲的主站點與應用程序直接讀寫、交互數(shù)據(jù);工作負載的主站點上則負責程序運行,但并不一定用于支持最終用戶。一級或二級應用程序(如ERP、CRM、Microsoft Exchange與SQL Server等)往往都被視為主站點上關鍵應用程序。在二級站點上,我們一般只會想到數(shù)據(jù)保護、歸檔、復制、重復數(shù)據(jù)刪除、壓縮、加密、分析報表以及二級應用的測試和開發(fā),這些應用需要使用到那些在主站點中產(chǎn)生,并在二級站點存儲的數(shù)據(jù)。
不過,今天在二級站點領域發(fā)生著翻天覆地的變化,其中充斥著各種晦澀而混亂的概念,大量的供應商通常只針對解決某個單一的問題。事實上,直到最近業(yè)內(nèi)才開始從一種統(tǒng)一的視角來觀察以往這些形態(tài)各異的,位于二級站點的應用和數(shù)據(jù)。
這些定義并非明晰確鑿的:雖然這聽上去有些奇怪——存儲與應用究竟是在主站點還是二級站點上,其邊界相當模糊。我們就此展開全文。
從主站點上著手
現(xiàn)在數(shù)據(jù)的二級存儲像主存儲那樣,正在開始經(jīng)歷一種結構性的轉變。我們首先總結歸納出在主存儲端所發(fā)生的事,因為這同樣適用于這場在二級存儲上展開的變革。
煙囪式的主存儲帶來了相當大的混亂,對成本、時間效率以及應用程序性能所造成的影響數(shù)不甚數(shù)。所幸的是,我們已經(jīng)看到了虛擬化技術應用、橫向擴展、融合,以及最近才出現(xiàn)的超融合所帶來的諸多改善。
虛擬化技術抽象了計算資源,改變了我們提供和管理硬件資源的方式。融合則以集成的方式將計算、存儲、網(wǎng)絡與虛擬化相結合,使得基礎架構更易于購買、交付和管理。超級融合從本質(zhì)上將計算、存儲和存儲網(wǎng)絡(SAN、NAS)融合到一個單一的實體和橫向擴展的架構之中,從而顛覆了整個行業(yè)。
由于超融合技術消除了IT行業(yè)在過往的三十年內(nèi)一直想要解決的痛點,其成長與發(fā)展遠未有結束。例如說,超融合可以減少或消除計算與存儲資源在配置、微調(diào)、交付、管理以及仲裁方面的負載,并且很快會涉足到網(wǎng)絡領域。
問題在于……
假如說超融合對數(shù)據(jù)存儲和工作負載的主站點而言能帶來如此多的收益,那么其能在二級存儲方面發(fā)揮同樣的作用嗎? 雖然超融合有諸多創(chuàng)新,但上述問題的答案是,“不”。
從概念上看這樣做似乎不難。我們應該應用超融合、橫向擴展的文件系統(tǒng)、虛擬化、軟件定義存儲(SDS)等技術,令二級站點像主站點那樣更具效能。
但這著實是一項艱巨的挑戰(zhàn)。我們不禁開始思考是否有可能開發(fā)出一款包羅萬象的產(chǎn)品來囊括所有二級站點上負載,而非各種功能的胡拼亂湊。
在解決這項難題之前,讓我們先來描繪出這項新的體系結構所要達成的目標。
超融合二級存儲
在Taneja集團內(nèi)部,我們已經(jīng)將這種新的體系結構定義為超融合二級存儲。命名規(guī)則相當簡單:這類產(chǎn)品應用超融合原則,并完全服務于二級站點的工作負載。
在開始閱讀我們對這種全新超融合二級存儲概念所做定義時,請注意,有些產(chǎn)品即使缺少某些特定的功能,但它們或許仍然會屬于超融合二級存儲這個范疇。其中的關鍵點在于,“產(chǎn)品的架構是否便于增加新的功能,而非從功能上完全進行重構?”目前市場上各供應商的產(chǎn)品沒有完全符合上述定義:有一些較為接近而另一些則完全不同。所有這些都與主存儲端的超融合技術發(fā)展完全一致。
另外,你還必須確定缺失的內(nèi)容對你而言是否是至關重要的。這里所列出的是超融合二級存儲所應涵蓋的基本要求:
存儲必須使用節(jié)點的體系結構,支持幾近***的“橫向擴展”模式,事實上,“***”意味著這種結構與當前的公有云相同;即,對于特定的應用集合,結構可以***按需擴展,而不用擔心性能下降或增加延遲的風險。
存儲能夠自動應對處理多項不同性能需求的工作負載而無需人工介入調(diào)整。使用在應用主站點的超融合架構原理在此同樣適用。
軟件定義是這類存儲的核心,其使得控制層與數(shù)據(jù)層分離,從而令系統(tǒng)可以使用市場上絕大多數(shù)現(xiàn)有的硬件,擺脫被硬件鎖定的風險;同樣,其既可以在本地,亦可以運行于云端。
存儲與公共云或私有云緊密集成。除了將數(shù)據(jù)發(fā)送到云端外,這還意味著能夠在云端完成數(shù)據(jù)的管理與保護。其必須能夠無縫得將云作為一個存儲層。
存儲可以應對處理當前或未來可能出現(xiàn)的所有二級站點的工作負載。在今天,這或許意味著數(shù)據(jù)保護、存檔、災難恢復、復制、數(shù)據(jù)遷移、重復數(shù)據(jù)刪除、壓縮加密、測試/開發(fā)以及復制數(shù)據(jù)管理(CDM)和分析。
存儲至少能夠支持多種混合的數(shù)據(jù)塊、文件與對象協(xié)議,其中包括iSCSI、光纖通道、NFS、SMB和REST,并且能夠在同一個存儲池中儲存所有的文件和對象。
存儲完全基于策略。首先設置工作負載的策略,可能使用預定義的模板,然后系統(tǒng)管理整個數(shù)據(jù)生命周期和工作流程,包括啟動和拆卸基礎架構資源,而無需操作員參與介入。
存儲具備的服務質(zhì)量(QoS)控制。根據(jù)定義,許多二級應用程序要運行在基礎架構,因此系統(tǒng)必須能夠根據(jù)預設的策略自動分配資源,并且有適合的方案來確保其合規(guī)性。
存儲可以和主站點的存儲資源那樣同時支持物理與虛擬的工作負載。
存儲可以索引元數(shù)據(jù)與內(nèi)容,具備構建定制化分析的能力,能夠支持復雜的搜索功能,包括在文件中搜索數(shù)據(jù)的能力。檢索的結果通過標準的API反饋給應用程序。
存儲可以通過一個基于Web頁面的管理控制平臺,經(jīng)由任意可以接入互聯(lián)網(wǎng)的位置管理到整個二級基礎架構——并根據(jù)客戶需要設定全局命名空間。其能夠和常見管理平臺(例如VMware的vRealize Automation)相集成。
存儲體系結構具備自我修復的能力,在發(fā)生故障時不需立即更換故障部件;可以應對多塊磁盤與節(jié)電的故障;不會喪失靈活性與可用性;毋須進行數(shù)據(jù)遷移;且IT可以實時調(diào)整系統(tǒng)的彈性。
存儲可以內(nèi)設數(shù)據(jù)虛擬化策略,從而確保某個數(shù)據(jù)副本可用于多項應用程序的工作負載。
存儲具備企業(yè)級安全性,包括后端的靜態(tài)數(shù)據(jù)加密,以及活動數(shù)據(jù)的存取訪問控制。同樣,存儲可選第三方的密鑰管理器。
存儲提供以秒和分鐘測量的恢復點目標,具有瞬時恢復時間目標(不需要進行數(shù)據(jù)回算和重構)。
行業(yè)中存在著一種普遍的誤解,即Hypervisor是實現(xiàn)超融合技術的先決條件。由于超融合技術首先使用在主站點并適用于虛擬工作負載,于是看似使用一項Hypervisor虛擬機管理程序必不可少。 但隨著行業(yè)向容器(container)技術轉移,這種先決條件將逐漸消失。 在二級站點上的情形同樣如此。
正如你所看到的,上述這些將成為一項廣泛的需求。 我相信當前我們正處于這樣一個時刻,即所有適合的技術都可以實現(xiàn)這種愿景。 目前市場上的數(shù)款產(chǎn)品已經(jīng)非常接近,而其他供應商在接下來的18個月內(nèi)爭相達成類似的目標,而另一方面,由于當前的架構設計,有些供應商或許永遠無法做到。
超融合,準備好了么?
假如脫離一定的評估標準,想必會有不少的供應商聲稱他們的產(chǎn)品能夠滿足上述條件,但事實并非如此。那么,讓我們來仔細看看市場上這些不同類別的超融合二級存儲產(chǎn)品,以此了解更多。
在計算機科學領域,一項毋庸置疑的事實是:你的體系結構在設定以后,便決定了未來可以達成,或難以(有效)實現(xiàn)的目標。因此,對于大多數(shù)在幾十年前便從事數(shù)據(jù)保護與數(shù)據(jù)復制產(chǎn)品的供應商而言,他們很難支持橫向擴展的節(jié)點結構、虛擬化以及在過去五年出現(xiàn)的許多其它技術。
例如,假如某家供應商是CDM領域的專家,那么很可能他們要求受管理的數(shù)據(jù)副本必須要遷移到特定的數(shù)據(jù)庫中。數(shù)據(jù)保護則可能是(也可能不是)該產(chǎn)品的組成部分(換句話說,可能需要第三方數(shù)據(jù)保護應用支持),產(chǎn)品可能(也很可能)不支持橫向擴展。
各家供應商所提供的分析技術水平層次不齊,其中大多數(shù)仍側重于存儲利用率與數(shù)據(jù)保護指標。當由某家供應商單獨提供歸檔技術時,其很可能會形成信息孤島。云集成或許只是單純實現(xiàn)了數(shù)據(jù)傳輸功能。大多數(shù)重復數(shù)據(jù)刪除產(chǎn)品只是:用于減少數(shù)據(jù)副本的專屬設備。它們與同一(或不同)供應商提供的數(shù)據(jù)保護產(chǎn)品協(xié)同工作。橫向擴展只適用于有限的一些供應商產(chǎn)品,遠非市場上所有的方案。
與此同時,某些復制產(chǎn)品只能執(zhí)行特定的功能,從而又造成某項單一功能的封閉性。大多數(shù)產(chǎn)品缺乏真正的QoS功能。雖然可能存在服務級別協(xié)議和基于策略的控制平臺,但通常無法確定其合規(guī)性。經(jīng)過設計,對象存儲提供商可以具備橫向擴展、單一命名空間、完全可靠安全的平臺(借助糾刪碼),但往往會缺乏完整的文件支持,并且難以支持上述所有二級站點的工作負載。
經(jīng)由過去三十年的不斷發(fā)展,今天支持二級站點的產(chǎn)品系列遍布各個領域。其中的絕大多數(shù)只是被設計完成單一的使命,從這點上講這些產(chǎn)品做得不錯。但是世界正在發(fā)生改變,單靠數(shù)據(jù)保護是遠遠不夠的。我們必須重新思考和定義海量信息、消費數(shù)據(jù)、合規(guī)性、社交媒體、移動應用、云計算和大數(shù)據(jù)分析領域的保護與可用性的整理范例。
雖然從本質(zhì)上去轉變二十年前架構的產(chǎn)品很困難,但供應商們卻在努力嘗試,有時經(jīng)由自己的開發(fā)團隊,更多的則是借助合作伙伴。他們?nèi)绾芜_成目標,或者如何達成目標,我們拭目以待。
今天有兩家企業(yè),他們的視角與本專欄所定義的最為接近。Cohesity滿足了上述大多數(shù)的標準;Rubrik也較為接近,只是缺失了些許關鍵部分。 CDM領域的供應商,例如Actifio和Catalogic也有許多產(chǎn)品,很可能會彌補這些空缺。 IBM Spectrum Copy Data Management利用Spectrum Protect,并且(最有可能)將其與IBM Cloud Object Storage緊密集成,從而提供橫向擴展功能。同時我們也不應該忘記,SimpliVity(最近被HPE所收購)以及Scale Computing曾公開展示在單個基礎架構中為主存儲和二級存儲應用實現(xiàn)超融合的愿景。
在諸如亞馬遜網(wǎng)絡服務(Amazon Web Services)等公有云服務商的領導下,主數(shù)據(jù)存儲端的改造業(yè)已在過去十年推動了整個行業(yè)的發(fā)展。我認為超融合技術直接來自于將公有云的理念應用于企業(yè)自行部署的基礎設施。同時我還相信超融合技術會運用于數(shù)據(jù)中心內(nèi)具有相同重要性的二級存儲。在這方面的需求量甚至會更大,畢竟存儲于二級存儲中的數(shù)據(jù)占到了整體數(shù)據(jù)量的80%。
我們可以使得二級存儲大放光彩,利用它實現(xiàn)更好的業(yè)務決策;同樣,它也可能變成龐大而臃腫的數(shù)據(jù)堆棧。昨天的體系架構很難幫助我們帶到前者。二級站點需要和主站點一樣基于超融合技術。