電商混合云在1號店的運維實踐
在技術開發的整個周期中,運維平臺是支撐生意發展最基本的保證。今天跟大家分享混合云在電商中的應用,如何做到成本優化和高效穩定兼顧,下面我們一起來解密1號店的電商混合云。
混合云
融合了公有云和私有云,是近年來云計算的主要模式和發展方向。我們已經知道私有云主要是面向企業用戶,出于安全考慮,企業更愿意將數據存放在私有云中,但是同時又希望可以獲得公有云的計算資源。
在這種情況下混合云被越來越多的采用,它將公有云和私有云進行混合和匹配,以獲得***的效果,這種個性化的解決方案,達到了既省錢又安全的目的。
下面我們跟隨1號店的案例,來了解電商企業是如何思考和運用混合云的:
1號店營銷帶來各種業務高峰
1號店的營銷創意常常能夠讓人眼前一亮,留下深刻印象,引發互聯網業界的大范圍傳播,如下圖:
“牛奶吉尼斯”活動,目標是沖擊“當日銷售牛奶盒數最多”的吉尼斯世界記錄。
“11•11屬于全人類”活動,是在11月11日當天,包下了紐約時代廣場的大屏幕,展示“11•11屬于全人類”的文字,喊出了電商人的心聲,借此調侃國內某電商巨頭想壟斷“雙11”這個商標的荒唐行徑。
如何應對突增的訪問壓力?
成功的營銷帶來的是數十倍于平日的訪問壓力,如何應對這些訪問壓力?最直接的方式是增加服務器。
然而,我們注意到一個問題,數百臺的服務器如果只是為了每年幾次的營銷活動而準備,利用率是非常低的,對公司而言這樣的成本投入是不劃算的,所以我們考慮用公有云的服務器來應對營銷活動的訪問壓力。
1號店已經建立起了頗具規模的私有云平臺,在此基礎上構建了混合云管理平臺,混合云的接入和使用過程如圖所示。
1. 服務器校驗
首先,混合云平臺對公有云提供的服務器進行校驗,校驗內容包括IP地址、內存、硬盤等信息是否跟清單匹配,通過校驗后,混合云平臺把機器配置模板和鏡像傳輸給公有云機器。
2. 服務器授權
接著,混合云平臺對公有云機器進行授權,通過授權的混合云機器才能夠訪問私有云網絡資源,否則訪問會被拒絕訪問。
3. 公有云初始化
然后,通過之前拷貝過來的配置模板,對公有云機器進行初始化,使公有云機器從一臺裸機變成符合生產環境配置要求的生產機器。
4. 部署及回收公有云
***,通過自動化發布程序,把應用部署到公有云機器上,它就可以對外提供服務了。在使用結束后,混合云平臺會對混合云機器的授權進行回收、費用結算等操作。
5. 混合云管理平臺工作流程
下圖是混合云管理平臺工作流程圖,私有云和公有云是通過混合云管理平臺進行整合,共同為業務提供服務。
#p#
實施混合云的6項注意
在實施混合云的過程中,需要注意6個方面:成熟的私有云平臺、帶寬和網絡延遲、IO性能、API接口支持、穩定性和安全性。
下面我們分別加以敘說。
1. 成熟的私有云平臺
首先需要強調的是,成熟的私有云平臺是實現混合云的前提條件。否則還是少談混合云的事情,否則顧此失彼,首尾難顧。這是因為:
只有企業自身已具備完善的管理流程、高度自動化的運維管理和監控預警系統,在這基礎上,再將公有云的資源納入到管理體系中,才能夠很好的對這些外部資源進行高效管理。
與此同時,企業在發展的過程中,需要逐步進行運維平臺的升級,一步步過渡到自動化運維、私有云的階段,這些都是不斷積累和演進的結果。
2. 帶寬和網絡延遲
在業務邏輯復雜的電商系統中,對數據交互、交易事務的完整性要求很高,幾十毫秒的數據延遲都可能導致交易失敗,混合云的場景下網絡延遲是不可避免的,這就必須從應用層面做出規定:
核心交易相關應用不能使用混合云,同時優化應用程序,以減少帶寬。
比如,有的開發人員喜歡在一個for循環里進行程序調用,在混合云的架構中開銷就太大了,所以必須把循環調用,改成批處理方式去提交作業。
一般而言,能夠接受的延遲是10毫秒以內。通過拉專線或光纜,連接私有云和公有云,如果兩個IDC在不同的城市,那么距離一般需要控制在200公里左右。
3. IO性能
公有云服商機器的IO性能差別是很大的,在選擇供應商的時候要關注IO性能,如果把主從關系的數據庫放在公有云上,那對IO的要求是非常高的,許多應用場景中,程序大量讀取備庫,稍有性能問題,會導致線上事故。
選擇使用了SSD硬盤的公有云提供商,是個不錯的選擇。
4. API接口支持
良好的私有云平臺應該有豐富的API接口支持,方便跟公有云對接,提升接入效率,使云服務的費用結算更精確。
比如,當完成了跟公有云的對接后,我們可以隨時開通公有云的服務,而且使用了多少機器、使用了多久,都可以實時查到,真正做到像使用“自來水”一樣的使用云服務。
5. 穩定性
云服務發生故障的概率還是不小的,這需要流量調度機制足夠靈活,一旦出現問題可以立即切換回私有云,根據業務特點能夠實現秒級、分鐘級的切換時效。
另外對公有云要做比較完備的監控、心跳檢測等等,一旦發現服務不穩定,可以通過GSLB,把流量切回私有云。
相反的,如果私有云有問題了,也可以把一些流量切換到公有云上,這是混合云平臺必須具備的能力。
6. 安全性
將公有云與私有云進行整合后,公有云機器相當于進入了企業數據中心,如果公有云的機器沒有做好安全管理工作的話,會對企業數據中心造成威脅。因此公有云和私有云的通訊必須做嚴格的審計和限制,敏感數據不保存在云端。
安全問題,我個人認為主要有兩個挑戰:
一個是在技術層面,技術問題也許經過一段時間,隨著技術的發展會得到解決;
另一個是心理層面,國內企業的老板們對云的安全性都有顧慮。他們覺得“錢放在外人那里,哪有放在我家枕頭下安全”。
如果今天你跟你的老板說我的用戶我的數據都在公有云里,老板一下子就把你拍死了,你沒有機會跟他解釋,在技術是如何的有安全保障。
所以,怎么合理規劃、站在公司的角度來充分考量整個方案(而不僅僅是技術方案),非常重要。
以上就是我在混合云實踐中的一些思考和經驗,正如我在新出版的《技術管理之巔》一書中介紹的,希望對大家有一些借鑒作用:
“技術與業務融合,能夠驅動業務的發展,發揮技術的巨大價值。” |
關于作者
黃哲鏗1號店,技術總監
負責云計算平臺、移動分銷、互聯網金融等領域工作。曾服務于MySteel,曾作為技術合伙人參與龍財網、UFO鞋業等創業項目。
2015年出版個人專著《技術管理之巔—如何從零打造高質效互聯網技術團隊》,個人擁有多項技術發明和專利,在超大型電商系統設計、大型IT團隊治理等領域享有盛譽。
熱愛生活和搖滾樂,曾接受《芭莎男士》等時尚雜志采訪。