云計算任務行之有效的方法
一個追求卓越品質的云存儲解決方案提供商或服務商在解決云存儲問題時不可避免要處理一些云計算任務。本文嘗試揭示一個事實:一個志向遠大的云存儲商為提供優質云存儲服務,它所要解決的云計算問題一般具有很強的挑戰性,屬于云計算問題中比較難解決的一類。為此我們可以把一個計算問題,不論是“在云上”計算的還是在“云下”本地計算的,抽象成為一個術語叫做“命令行”的如下表達式:
命令 輸入 輸出;
其中“命令”表示計算任務的執行代碼,“輸入”表示計算任務所要處理的輸入數據,而“輸出”表示計算任務完成后的輸出數據結果。舉一具體命令行的例子:
1.WordInFile OutFile; (用Office Word對文件InFile作文檔處理后將結果存儲為文件OutFile)
對于一個用戶,如果計算是“在云上”發生的,那么命令行“命令 輸入 輸出”是在用戶所租用的數據中心服務器上執行的,用戶的輸入輸出數據也都存儲在數據中心。而在“云下”的情形,用戶則要用自己擁有的計算資源來執行命令行并且還要自己存儲與管理數據。為了本文的目的,以下讓我們只考慮“在云上”的情形,并且用“云命令行”來稱呼一條在云上執行的命令行。
于是云命令行描述了一個典型的云計算任務,比如Google Docs就提供這樣的在線辦公軟件服務。一個優質的云存儲方案/服務提供商不可避免要解決一些云計算任務。我們也可以用云命令行來為這樣的云存儲商抽象描述出幾例它必須要執行的云計算任務。
2.DeDupip1:v1ip2:v2; (用重復數據刪除處理方案DeDup對IP地址為ip1數據中心服務器邏輯磁盤卷v1做重復數據刪除,將結果存儲到IP地址為ip2數據中心服務器邏輯磁盤卷v2上。這條云命令行描述了一個優質云存儲服務商為降低服務成本而必須要做的一項云計算任務。)
3.LoadBalanceip-1ip-2…ip-n; (在IP地址為ip-1, ip-2, …, ip-n的服務器集群中做存儲附載均衡,使每個服務器均衡發揮處理與存儲數據的能力,以優化服務質量。)
4.RAICVip-1ip-2…ip-n; (將磁盤卷V冗余分布到IP地址為ip-1, ip-2, …, ip-n的“低成本冗余云存儲商陣列”中去,此處RAIC = Redundant Array of Inexpensive Cloud storage service providers。這些低成本云存儲商因為收費低廉只能提供一些低端的,比如可能會掉線的,云存儲服務,而不追求為了提高服務品質,比如提供不會掉線的云存儲服務,所必須解決的云計算任務。
以上云命令行的例子(2),(3),(4)都還可以帶有云數據安全保護,比如對(2)加上數據安全保護,我們可以用下面類似Unix Pipe(管道)命令抽象出一個組合計算任務:先對加密數據做解密,再進行重復數據刪除,***將處理結果做加密存儲。下面是經過如此管道組合后得到的云命令行例子:
5.Decrypt–passphraseip1:c1|DeDup|Encrypt–passphraseip2:c2; (這條組合云命令行稍許有點技術細節,一般讀者略過這里的解釋無妨。其中passphrase是解密命令Decrypt與加密命令Encrypt所用的參數,它指向一個密鑰讓程序Decrypt(Encrypt)對輸入(出)數據做解密(加密)處理;符號“|”叫做“管道”,用來通知操作系統順序操作Decrypt;DeDup;Encrypt)。
我們還可以同理對(2)和(4)做管道組和,將重復數據刪除分布到低成本冗余云存儲商陣列中去,得到的結果是既可靠又低成本。還可以再加上(5),對低成本可靠的云存儲服務做數據作安全保護,以防止低成本云存儲商偷竊用戶數據。我們還可以考慮對云上數據作查詢檢索的任務,而且還可以基于安全策略的查詢檢索,等等,不在此一一列舉。
為什么我們說一個志向遠大的,著眼于提供優質云存儲服務的云存儲商所要解決的云計算任務會比一般云計算任務,比如云命令行(1)那樣的,更具有挑戰性呢?我們不妨作如下觀察:云命令行(1)一類的云計算任務通常為個體用戶所使用,為處理某個具體任務,相對比較簡單。所以因服務質量問題而對用戶造成的損害一般會比較有限,防范手段也相對容易實現。比如我們可以設想云命令行(1)在執行時服務器宕機造成用戶數據丟失。一個簡單的防范手段可以是讓云上的Word作頻繁的AutoSave。
一個比較大的計算任務也可以用比較頻繁的CheckPoint將計算中間狀態保存起來,以減小由于宕機而造成的損失。而云計算命令行(2)至(5)一類,以及對它們加以稍有點想象力組合而得的云計算任務不僅可以針對個體用戶提供高端云存儲服務,更加可能的情形是:這一類計算任務是我們通常稱之為“信息生命周期管理”(Information Lifecycle Management, ILM)的任務,主要是高端云存儲服務商所提供的存儲服務內容,其所面對的標準服務對象是企業或組織用戶。對這樣的用戶一般都要提供具備海量數據處理能力的ILM云存儲服務,其相應速度,可靠度,安全保護,版本管理,查詢搜索質量,等等,都必須是專業級的。對于這樣的ILM任務,我們不難得出結論:云存儲比云計算更具挑戰性,云計算只是云存儲的一個子問題。
【編輯推薦】