云宕機(jī)戰(zhàn)略:構(gòu)建冗余
云服務(wù)并不***。甚至像亞馬遜Web服務(wù)這樣的***都經(jīng)歷了各種宕機(jī)事件。好消息在于使用云計(jì)算,你同樣可以以某種途徑保護(hù)自己的服務(wù)遠(yuǎn)離云服務(wù)提供商宕機(jī)的影響,這種方法可能不適用于傳統(tǒng)的服務(wù)器托管。要記住在你的云計(jì)算宕機(jī)戰(zhàn)略中最重要的就是冗余。
除了傳統(tǒng)備份之外,對(duì)云宕機(jī)最有利的防衛(wèi)就是計(jì)劃冗余。想法非常簡單:如果一個(gè)服務(wù)器宕掉,其他服務(wù)器來接管,終端用戶甚至都不會(huì)注意到這個(gè)問題。
實(shí)現(xiàn)冗余的技術(shù)有很多。選擇之一就是把你的服務(wù)器放到朵個(gè)數(shù)據(jù)中心中。亞馬遜Web服務(wù)(AWS)為例,讓你來選擇可以把服務(wù)器托管在哪里。在這個(gè)案例中,可以把一個(gè)服務(wù)器放到弗吉尼亞的數(shù)據(jù)中心,將冗余服務(wù)器放在俄勒岡的數(shù)據(jù)中心。如果你的服務(wù)提供商不提供多種數(shù)據(jù)中心,你應(yīng)該在其他廠商中分布冗余,一些服務(wù)器放在AWS上運(yùn)行,一些放在Rackspace上。
下一步,準(zhǔn)備一個(gè)管理系統(tǒng)和合適的基礎(chǔ)架構(gòu),以便冗余能夠真正的在宕機(jī)事件中運(yùn)作。
像VMware的vCloud Director、Microsoft的System Center以及BMC的Cloud Lifecycle Management都可以持續(xù)監(jiān)控服務(wù)器。如果一個(gè)服務(wù)器宕機(jī)了,可以將其從活躍服務(wù)器集中取出,直到你找到備份。為了實(shí)現(xiàn)這項(xiàng)工作,你需要配置你的域名系統(tǒng)(DNS)服務(wù)器,以便當(dāng)一個(gè)客戶端,比如一個(gè)瀏覽器,為一個(gè)URL尋IP,其地址能夠返回到尋址的那一個(gè)服務(wù)器。這樣就能夠?qū)⒖蛻敉钴S服務(wù)器;連接,跳過宕機(jī)服務(wù)器。
大型企業(yè)很可能已經(jīng)使用DNS配置,但是更小的公司并沒有使用復(fù)雜管理軟件,但仍有辦法實(shí)現(xiàn)容易。讓第二服務(wù)器準(zhǔn)備運(yùn)作,但是關(guān)掉。一些云廠商對(duì)于關(guān)掉的服務(wù)器不收費(fèi)。在宕機(jī)事件中,啟動(dòng)冗余服務(wù)器,直接到你的DNS管理器,并轉(zhuǎn)換IP地址指向新的服務(wù)器。效果可能不是立刻的,但是通過現(xiàn)在的DNS服務(wù)器,應(yīng)該可以快速工作。DNS管理器可以在變更發(fā)生前24小發(fā)出警報(bào),但是在實(shí)際中,通常是15分鐘。要指出的是:如果你維護(hù)的傳統(tǒng)服務(wù)器斷電了,你要確保用***版本軟件定期升級(jí)。
提前采取正確的措施和計(jì)劃協(xié)助企業(yè)能夠更好的應(yīng)對(duì)云宕機(jī)。如果宕機(jī)發(fā)生了,終端用戶只會(huì)經(jīng)歷短時(shí)間宕機(jī)或者根本就不會(huì)體驗(yàn)到。