將關鍵性業務應用遷移至云環境前,必須弄清的五個問題
譯文面向云環境的遷移工作正如火如荼地進行。在去年的Gartner IT研討博覽會上,超過半數CIO表示將把云優先戰略作為接下來的運營重心。Verizon公司在其《市場狀態:2016年企業云》報告中提到,有84%的受訪企業表示其云使用量在過去一年中迎來顯著提升,而且有半數企業宣稱其到2018年至少將把75%工作負載遷移至云端。更值得一提的是,亦有半數受訪企業正在使用兩到四家云服務供應商的產品。
無論大家正著眼于面向云環境的遷移、考量云產品線多樣化還是僅僅在比較跨越云環境的性能與價值水平,認真審視以下五個關鍵性問題都能夠幫助各位做出更為理性的決策:
* 大家如何監控自己的互聯網基礎設施? 大家在對自己的內部基礎設施與應用程序進行監控時,會收集到哪些負責將客戶與自身業務相對接的外部互聯網連接的相關信息?如果指向特定數據中心的連接發生故障,又或者某家云服務供應商無法覆蓋特定市場區劃,大家的系統管理員必須擁有必要工具以將流量重新路由至其它數據中心,從而保證服務的正常運轉。另外,如果大家遭遇高延遲或者服務質量下降,您的IT團隊也必須了解如何監控這些問題并對性能做出及時優化。
另一個需要認真考量的問題在于了解自己的“平均解決時間”——即能夠以何種速度精確識別造成客戶影響的問題根源,其具體來源可能包括應用程序、數據中心計算環境,又或者基于互聯網路由、宕機乃至云/SaaS供應商。雖然云服務供應商、CDN以及加速服務方都宣稱能夠提供“始終在線”承諾,但這并不意味著客戶總能夠順利與之相對接。
*如果大家立足于一家全球性企業,該如何確保云環境下的全球可用性? 如果大家的最終用戶會立足于全球任意位置對您的互聯網資產進行全天候訪問,那么各位無疑需要確保自己的最終用戶體驗在各個位置保持對等——無論其于何時、何地訪問我們的網站、應用或者內容。保障可用性意味著如果我們的服務是否可用于客戶及合作伙伴。要實現這項目標,最重要的一點在于了解我們所選定之云服務供應商與CDN的網絡連接性能。
2015年發生的谷歌云宕機事故持續近兩小時,其根源在于虛擬網絡流量路由機制中的一項軟件問題。如果大家的業務使用單一云實例配合谷歌云客戶端,而各位又沒有對網絡可用性進行全程監控,那么大家很可能會全面遭遇這場宕機并導致可用性受到嚴重影響。
因此,我們該如何確保自己的業務能夠擁有強大的可用性,而不至于受到本地互聯網狀態或者世界各地區域網絡條件的限制?將業務分布托管在多家云服務供應商站點中能夠確保客戶免受單站或者單一區域宕機的影響。作為另一項建議,大家還應當監控自己的全球網絡,從而檢測其當前負載水平。我們需要關注性能問題,并利用現有工具進行負載均衡,從而確保整套業務體系隨時擁有理想的可用性水平。
*使用單一云服務供應商即可,還是應當考慮選擇多家供應商? 雖然各家云服務供應商所能提供的方案千差萬別,但同時使用多家服務是實現業務持續性與風險緩解戰略的惟一途徑。我們還可以利用這種有效策略管理峰值使用量、成本波動與全球負載均衡。
同時選擇多家云服務供應商能確保我們的企業訪問不同云實例(本地),從而立足于本地市場考量客戶需求并充分利用本地網絡連接的性能優勢。而跨地理位置使用高級DNS流量管理解決方案,則能夠幫助大家確切控制由哪些實例服務哪些客戶,同時通過正確工具以集中化方式對各類實例乃至供應商服務加以管理。
同時選擇多種云方案能夠幫助我們的業務擁有更出色的靈活性與價值回報,允許大家提供規模可伸縮且始終在線之業務印象。這種訪問不同路徑的能力還能夠切實解決系統宕機或者載入速度過慢等問題——無論其源自流量路由問題還是惡意攻擊。除此之外,選擇多家云服務供應商還能幫助大家盡快對流量進行重新路由,從而確保將中斷狀況控制在最低水平。作為額外收益,選擇多家云服務供應商還允許大家將應用程序與服務部署在兩個(或者更多)云實例當中,這樣它們就能夠利用全局負載均衡或者故障轉移架構實現相互備份,從而在問題發生之前建立保護措施。
*優化互聯網性能的最大風險是什么? 最大的風險在于大家可能并不了解業務性能的實時狀態——其中包括互聯網延遲問題來源、全局可用性與可接入能力等以及最終用戶的真實性能體驗如何。在潛在客戶訪問域名與正式打開頁面之間的時間段內,種種意外狀況都有可能突然發生。網絡內部可能出現CDN或者ISP層級的錯誤,大家的SaaS供應商或者客戶自己的網絡連接也可能遭遇故障。另外,網站響應速度也會受到多種因素的影響,而且大多數客戶——乃至企業客戶——往往并不清楚遭遇性能問題的原因與方式。
通道故障、路由異常、延遲、丟包、安全威脅(例如中間人攻擊與DDoS)還僅僅是影響流暢網絡運轉的常見風險中的一小部分。了解自己的網絡連接并對其加以監視、控制與優化,同時對互聯網性能切實加以測試,只有這樣才能真正掌握并應對網絡中的各類薄弱環節。
*在遭遇宕機事故時,我們該如何保證站點正常在線? 宕機會給企業的正常業務造成嚴重影響,而且出現存在著令人驚訝的規律性——每天全球互聯網會出現超過3000次宕機狀況。另外,大多數企業其實很難在不涉及客戶與內部資產的前提下,對互聯網連接故障進行檢測。
對面向互聯網架構的不斷監控是惟一能夠確保企業自身免受宕機長期影響的可行手段。如果大家無法妥善檢測宕機問題,那么各位的業務將無法真正對銷售額損失、營收下滑乃至客戶流失等風險進行響應與緩解。有鑒于此,物色一家真正有能力洞察我們基礎設施的合作伙伴將幫助大家積極應對宕機風險,包括在宕機出現之前或者之中發現問題、即時做出改道決策等等。
原文標題:5 questions to consider as you shift more business critical applications to the cloud
【51CTO.com獨家譯稿,合作站點轉載請注明來源】