云存儲(chǔ)可以取代企業(yè)的現(xiàn)場(chǎng)存儲(chǔ)嗎?
云計(jì)算提供商提供了許多不同的存儲(chǔ)服務(wù),但是對(duì)于大多數(shù)應(yīng)用程序來(lái)說(shuō),這些服務(wù)都不是理想的,因?yàn)樗鼈兪蛊髽I(yè)存儲(chǔ)供應(yīng)商處于繁重的存儲(chǔ)業(yè)務(wù)中。那么,云計(jì)算供應(yīng)商是否能夠取代關(guān)鍵應(yīng)用程序的現(xiàn)場(chǎng)存儲(chǔ)?
亞馬遜網(wǎng)絡(luò)服務(wù)(AWS),谷歌云平臺(tái)(GCP)和微軟Azure等云計(jì)算提供商都提供各種云服務(wù),從高性能、基于SSD的容量到長(zhǎng)延遲存檔存儲(chǔ),其價(jià)格優(yōu)惠范圍從高到低。但是大多數(shù)應(yīng)用程序都有各種I/O需求,從對(duì)延遲敏感的元數(shù)據(jù)更新到帶寬吸收備份。沒(méi)有單一的云存儲(chǔ)服務(wù)是理想的。
應(yīng)用程序開(kāi)發(fā)人員知道這一點(diǎn),并經(jīng)常在其代碼中執(zhí)行非自然的行為以克服云存儲(chǔ)缺陷。兩個(gè)主要問(wèn)題是成本/性能權(quán)衡和非彈性部署邊界。
成本/性能權(quán)衡
存儲(chǔ)層次結(jié)構(gòu)(更簡(jiǎn)單的時(shí)內(nèi)存、磁盤(pán)和磁帶)反映了權(quán)衡。快速存儲(chǔ)是昂貴的,并且廉價(jià)的存儲(chǔ)速度是緩慢的。
為了適應(yīng)不同的工作負(fù)載,企業(yè)存儲(chǔ)陣列可以自適應(yīng)地移動(dòng)數(shù)據(jù),將熱數(shù)據(jù)傳輸?shù)娇焖倬彺妫⒗鋽?shù)據(jù)移動(dòng)到磁盤(pán),或者在某些情況下,一直移動(dòng)到云存檔。但這很難與云存儲(chǔ)相關(guān),因?yàn)椴煌姆?wù)需要顯式部署,并提供不同的一致性保證。
非彈性部署
云存儲(chǔ)服務(wù)也傾向于僅提供單一度量彈性。例如,AWSS3服務(wù)隨容量而擴(kuò)展,但不隨I/O需求而擴(kuò)展。DynamoDB可根據(jù)I/O需求進(jìn)行擴(kuò)展,但在低延遲配置中卻非常昂貴。
在最近的一篇論文中,Cal Berkeley公司的研究人員探索了一種先進(jìn)的鍵值存儲(chǔ)系統(tǒng)Anna,旨在克服當(dāng)前的云存儲(chǔ)限制。鍵值存儲(chǔ)基本上是兩列電子表格,其中***列包含訪問(wèn)鍵,第二列包含企業(yè)要存儲(chǔ)的數(shù)據(jù)。
鍵值存儲(chǔ)已廣泛用于云服務(wù),但Anna實(shí)現(xiàn)了三個(gè)重要的優(yōu)化。
- 用于縮放的水平彈性
- 垂直數(shù)據(jù)移動(dòng),以適應(yīng)不斷變化的訪問(wèn)模式
- 跨多個(gè)核心和節(jié)點(diǎn)選擇性復(fù)制熱數(shù)據(jù)密鑰,以擴(kuò)展訪問(wèn)性能。
這些優(yōu)化旨在滿足聚合吞吐量增長(zhǎng),熱鍵現(xiàn)實(shí)以及工作負(fù)載熱點(diǎn)轉(zhuǎn)移的需求。
性能
Anna如何實(shí)現(xiàn)這些目標(biāo)有很多細(xì)節(jié)。但最重要的是:與Dynamo DB相比,它的運(yùn)作情況如何?
這是一張表,可以對(duì)這二者進(jìn)行比較:

適應(yīng)熱點(diǎn)是另一個(gè)考驗(yàn):

Dell EMC或NetApp公司可能為此感到擔(dān)憂。規(guī)模公共云存儲(chǔ)只有不到十年的歷史,并且正在迅速成熟,因?yàn)槠髽I(yè)存儲(chǔ)的增長(zhǎng)不足證明了這一點(diǎn)。
Anna不僅對(duì)提高績(jī)效非常重要,而且對(duì)成本的關(guān)注也很重要。云存儲(chǔ)標(biāo)費(fèi)率似乎合理,但是當(dāng)企業(yè)為目錄查找和數(shù)據(jù)網(wǎng)絡(luò)添加所有開(kāi)銷成本時(shí),企業(yè)存儲(chǔ)更具競(jìng)爭(zhēng)力。
任何能夠以更低的成本提高存儲(chǔ)效率的東西都是數(shù)字文明的勝利。但對(duì)于企業(yè)存儲(chǔ)供應(yīng)商而言可能并非如此。