如何以云計算為主題推進增值業務平臺建設
如何以云計算為主題推進增值業務平臺建設
2011年11月30日,由BMC軟件[NASDAQ:BMC]舉辦的云計算管理技術大會在上海舉行,會上各路專家將就云計算愿景、云計算應用、云計算管理、業務服務管理(BSM)等話題展開精彩探討。以下是BMC高級軟件顧問徐超先生的精彩演講:
今天很有幸和大家稍微分享一下BMC近期和浙江移動公司一起做的一個云計算的項目,希望讓大家對正發生在我們周圍的云計算建設有一些具體的了解。
BMC高級軟件顧問 徐超
這個項目帶有一些試點性質的項目,所在的業務單位是浙江移動網絡部,目標管理環境是其所轄的增值業務平臺。我們會看一下,這個客戶在進行這個項目的時候,對云計算,包括私有云的特殊性,他是怎么去看待的。另外我們會大體看一下BMC是如何針對客戶需求來設計和構建這個私有云的平臺,采用了哪些BMC的技術和產品。當然這個項目還在構建當中,我們可以看一下前期分析當中,包括現在可以看到的預期的具體收益。
首先看一下增值業務平臺,對浙江移動網絡部的IT管理對而言,增值業務平臺的用戶是各用戶的單位,他們會根據用戶的需求開發各種各樣的服務給移動的用戶,對這個管理團隊來講客戶是移動內部的業務單位,就這個業務本身而言是處于相對比較快速變化當中的,既有業務容量的增加調整,也有各種新業務不斷的涌現,平臺本身處在一個非常快的變化當中。在本期項目之前,平臺已歷經三期建設,本期云平臺的建設是契合增值業務平臺的擴展和完善來展開的。
現在的增值業務平臺從浙江移動來看有兩個數據中心,并且當前還在構建第三個數據中心,基礎架構的類型包括主流的服務器、存儲及網絡設備,同時包含相當的虛擬化的技術;作為試點項目而言,當前服務器管理的規模在300個左右,支撐的業務類型是各種各樣的增值業務,包括天氣預報,來電助手,彩信等等之類。另外,從項目背景看,在這個項目開始之前,BMC跟浙江移動也有相關的合作,主要是針對前三期已經構建的平臺,使用BMC的性能-可用性管理平實現對平臺基礎架構對象的監控,以幫助日常運維管理。所以在本期項目開始之前,他們正在使用BMC的監控和網絡管理產品。
當時我們跟浙江移動的客戶具體來分析,增值業務平臺這種類型的服務,整個過程是什么樣的。這是一個比較典型的從開通開始的過程,里面會包含很多內容,有一些是跟IT無關的,管理類的,要申請,要可研,要分析,要評估,這些都跟管理相關,然后會做資源劃撥,會請供應商進場,甚至會專門采購機器。在部署完成之后,會有一個交接的過程,最后會有一個納入到既有的模式當中的過程,比如做合規,定期做補丁,實時做監控等等,包括日后常規的運維。整個平臺運行的模式跟前面所提到的公共云模式不太一樣,是基于既有資源管理上的擴張,而非從零開始的基礎架構+管理平臺構建。后面我們會看到BMC和客戶基于對業務需求和IT管理團隊定位,對本私有云的項目進行了分析和調研,為它設計一個非常具體化的解決方案。
在跟客戶討論和分析它現在面臨的一些現狀的時候,BMC從多個角度跟客戶一起查看分析。我們簡單看一下我們從哪幾個角度給客戶做了相關分析和調研,包括管理規模現狀,管理規模增長趨勢,流程與操作,配置管理,人員與組織,服務水平,用戶使用方式,資源回收及使用管理等幾個行為區域。最終BMC幫助用戶從業務挑戰、申請/審批管理流程、部署/配置操作、配置管理、資源管理及有效使用這幾個角度做了一個匯總。首先從業務挑戰方面,來自業務部門,市場部門的一些變更上的壓力,包括內部管理上的壓力,然后從管理流程審批上面,從人的角度,從管理規范角度看,溝通上的問題,然后從具體實施部署,供應商管理,設備的維護角度做一些分析,另外我們從它的資產和配置角度進行了相應的分析,之前是沒有一個很好的配置管理的,有些配置不在自己的內部員工手里,要了解具體的配置還需要找相應的供應商,最后也是幫助他們做了相關評估和容量方面的分析,看機房環境運行的CPU的消耗還是比較低的,也會意識到說,未來有一個好的平臺幫助他跟蹤資源的使用情況,能夠比較有效的進行資源利用……這種比較細致的分析和梳理得到了用戶的認可,可比較明確本期項目的目標。
浙江移動的客戶也很認同業界比較公認的云計算的定義,我們一起跟他做了相應的解析,包括自服務,他希望能夠改變他的服務姿態,不是用戶通過郵件的方式去反復的討論相關的請求,而是希望基于已經提供那么多的服務平臺,抽取一些共性,包裝出來形成一個自服務的方式;包括減少干預,雖然自身人比較少,他們希望能夠用更加快速的方式提供一次性交付;包括做到服務的可計量,從而對他未來后續的轉型獲得一個更好的定位。最后客戶自己會有一個比較明確的做私有云的目標。從目標看,還是回歸到管理本身,也就是提高資源使用效率,降低運維成本,優化業務支撐;這一點和我們前面提到的云計算和BSM殊途同歸是一個意思。把他們的出發點做了分析之后,這個項目的目標就比較明確了,一點是對外,更加好的服務交付能力,使用戶有更好的服務感受,比如服務的用戶可以在服務請求階段就能夠介入這個系統,可以通過簡化的方式去提供服務請求,原來既有的方式是開很多會議,做很多溝通,寫很多文檔,這些行為方式和管理過程都會被簡化和優化,使用戶服務消費感受有所提升。另外一點是對IT內部而言,也就是改善自有資源管理的能力,包括可以非常快速的部署用戶所需要的硬件和軟體,包括可以非常好的管理IT負責的配置和資產,包括有一種非常有機的方式使機房的利用效率不斷提高,又保持在一個比較健康的水平當中,而不是說買了很多機器都處于比較低下的CPU的利用率,這樣會帶來無用的資金壓力。
和硬件以及虛擬化技術廠商不同,BMC做云計算,尤其是私有云的理念是比較回歸IT管理本源的,具體我們看一下這期業務增值平臺四期的業務,大體來看包含幾塊。第一塊從流程角度看,希望能夠改變用戶消費,或者用戶使用資源的一種方式,去構建一種自服務的門戶,去梳理服務目錄,形成一本IT給用戶的服務菜單。里面有相關業務和技術的審批納入到服務管理當中去。第二塊,用戶自己取的名字叫資源管理,從我們角度來講是以配置管理為核心的,包括說在虛擬化和云計算上不可缺少的資源池化的管理。第三塊是自動化管理,這塊用戶希望能夠實現多層的復雜環境的自動化資源部署,未來浙江移動增值業務平臺所希望的模式是,用戶請求了一個我既有菜單相應服務之后,就能夠幫助用戶把服務器、存儲、網絡、包括多臺服務器之間的連接關系,以及上面使用的軟件都已經配置好,這就是多層復雜環境的資源部署的要求。另外除了面向最終用戶之外,他們也希望通過自動化平臺去解決IT內部工作的壓力,比如他們定期要到機器上面看一些狀態,要在內部運維當中做相應的工作,他們希望通過自動化的方式把這些補丁、備份、合規、甚至監控運維等相關的內容自動化。最后一塊是主動監控,在運計算平臺構建之后,既有的監控系統會面臨一些視角的偏頗,建設內容主要是從業務角度從池化角度等視角去實現監控管理,增值業務平臺原來已經正在使用BMC的監控產品,在這期項目當中我們會基于前面,包括它整體的云計算的架構設計去突出對云計算,包括業務視角的主動監控上的加強。
在整個項目架構設計和產品選型的時候,浙江移動的客戶也比較接受BMC最核心的理念就是云計算立足于IT服務管理,因為用戶會非常真實的感覺到,他構建私有云平臺,不是從零開始的開天辟地,不是重新買機器,重新買軟件的過程,而是對既有環境——包括IT基礎架構、管理流程、管理方法、服務方式提升的過程,也會意識到這個云計算平臺構建過程的本身,也是慢慢提升IT成熟度的過程。另外,用戶希望能夠選擇一個產品化的解決方案,而不是開發式的或者各個模塊堆砌式的方案,希望有一個產品化解決方案構建這個云計算平臺,希望平臺本身是成型的,產品和技術是成熟的;當然平臺包含的技術有配置管理系統、基于ITIL的流程建設和服務請求管理、面向異構和多層基礎架構對象的部署操作自動化技術以及平臺的可用性和容量管理技術。另外,這個項目也肩負著一定集團里面試點的使命,也會特別強調說,未來這個平臺是可以擴展的,逐步有更多管理能力,未來可能能跟既有門戶做集成,未來有新的設備涌現,怎么在這個平臺進行異構環境的融合和持續管理。他們在經過多方的考察和評估后覺得BMC產品最符合他們既有的需求。
這張圖是解決方案當中整體的框架,可以看到前端IT人員或者負責云的人員根據服務梳理結果構建云服務的菜單——服務目錄,最終用戶會通過自助式的門戶瀏覽這些服務目錄,選擇特定的服務則會觸發相關變更的流程,如果需要審批,需要相關管理人員介入會有相應的流程管理,當相關流程被流轉完畢、服務請求被確認之后,會進入到自動化部署的平臺,系統會根據服務請求的具體需求規格和涉及的設備對象種類,調度具體不同的自動化模塊,包括對物理對象、虛擬對象、網絡、存儲、中間件等等應用整合的操作。同時還有配置管理的建設。作為增值業務平臺的定位,現在使用當中,它的資源回收的需求并不是非常突出,但用戶非常強調通過配置管理和容量管理這個方式做一個用量的跟蹤,使得現有使用效率比較低的服務器未來可以做一個有機的復用。在這張技術架構圖上,大家可以看到BMC一些主要的產品的定位和互聯邏輯,包括流程管理產品,配置管理產品,包括各塊的自動化的具體部署的產品實現。
后面幾頁會分大體的四塊內容稍稍具體的看看每一塊的具體建設內容。在流程管理這一層,最終選擇的實現方式是BMC云生命周期管理解決方案當中內嵌的Remedy流程引擎和Remedy服務請求管理模塊,主要的功能是覆蓋支撐服務申請,包括服務的自管理,然后會去管理相應請求的審批流轉,同時包括服務目錄模版和服務目錄的管理。通過使用Remedy這一內嵌ITIL最佳實踐的IT服務管理平臺,用戶既有的管理方法和流程、優化的流程以及未來的流程變化,都可以被平臺很好的支撐并得到靈活的擴展。在資源管理這一部分主要做三塊內容,一塊是傳統的資產管理,在這個項目當中,用戶希望隨著這個平臺能夠面向它的物理資產有一個比較好的工作和管理,比如說采購的時間,單位和維護人,服務約定等等。從技術角度,這些功能實現非常依賴于配置管理的實現,包括平臺本身運轉,會依賴有效的配置管理,因此CMDB也是本部分的重要內容。最后,作為云平臺,必然有資源的納管,資源的池化的工作,在BMC的平臺中,我們將軟件類的資源也包括在內。這張圖是我們跟用戶溝通配置管理理念當中,用戶比較認同的,也就是說配置管理如同ITIL所說的,本身是一種IT管理的使能能力,從服務視角、成本視角、邏輯系統視角及物理系統視角都可以得出不同的有價值的信息;云計算是配置管理使用當中另外一種場景,有配置管理和配置管理系統建設的共性,也有云計算平臺和用戶本身業務相關的個性,基于一套優秀的配置管理產品和豐富的配置管理建設經驗都是相當重要的。另外一塊,當前環境的設備種類比較多,操作的復雜性也較高,用戶會特別關注自動化能力這一塊的一些考量,因為大家知道我的設備會非常多,而且是異構的,平臺能不能支持我現有的設備操作,甚至能否支持未來出現的新設備,對平臺是至關重要的。從BMC來看,會把自動化能力的轉變分為兩個層次,一個是全程的操作標準化,比如我要定義操作定義的標準化——標準操作對象、理清操作目的,操作指令的標準化——標準操作指令與代碼,標準訪問參數與配置,操作接口標準化——標準訪問方式、標準訪問用戶,標準結果判斷,操作流程標準化——標準操作流向與異常處理;這階段有相當部分的梳理工作,當然也包含工具層面的固化,BMC的項目經驗和工具讓用戶感到這個過程將變得較為有序。當我們實現了全程標準化之后,我們需要做的是把各種設備的自動化封裝并整合起來放到一系列場景里面去。當我們要申請一個新的業務服務的時候,可能先要在存儲上面劃一塊盤,把它的系統卷做克隆,再分配一塊盤,作為數據卷,在網絡上面構建一個新區域進行隔離,在防火墻和負載均衡上配置相關策略等等等等,我們需要整個解決方案把各種對象的操作串聯起來,而且保持上下文的依賴關系,這就是資源調度的自動化。浙江移動在做項目選型的時候非常看中BMC在這塊的能力。BMC的自動化調度引擎可以有機的串聯相當復雜的操作步驟、流程和場景,甚至包括自動化全流程中人工因素的有機介入。就整個解決方案而言,里面包含的自動化組件有服務器對象的自動化,包括硬件裸機層面的支持,包括系統層面的支持,包括系統對象以上中間件及配置對象的支持;還有網絡對象的自動化,包括傳統路由交換設備、包括防火墻設備、包括負載均衡設備等等;此外還有存儲對象的自動化,包括SAN交換設備的支持;此外平臺組件還包括對容量檢測的能力,對于監控測量的能力等等。
這一頁是當前環境里面所包含的基礎機構的類型,相信在座各位大部分的老師和用戶,對很多設備會很熟悉,在您的環境中也一定有它們的存在。也可以看到,解決方案對設備,尤其是異構技術的支持是非常好的。這一頁也列出了對這些設備的常用操作,如我們前面說到的,操作包括資源供應/回收類型的,也包括服務于內部IT日常運維操作的,這些在平臺都有考慮到和很好的支持。
最后,我們在做項目評估的時候也跟用戶做了項目收益的預估和分析,其中一部分內容,即使當前項目仍然在進行中,用戶也在越來越清晰的感覺到。我們可以把整個收益分成兩大塊,一塊是跟成本和費用相關的:首先是通過標準化和自動化操作使手工操作的工作負荷減少,通過服務目錄和服務流程實現的服務標準化來大幅度降低溝通成本,包括由這些要素帶來的供應商依賴程度及服務成本的降低;此外還包括前面提到的,隨著資源利用效率提高帶來的基礎架構采購成本的規避等等。另外一塊是面向用戶的,就是服務水平的優化:首先會看到服務標準化的方式提升用戶的滿意度,提升用戶使用感受;同時可以非常明確的縮短整個交付的周期;另外能夠保證資源交付的質量——傳統來說,今天我請這個開發商幫我做部署,來的人不一樣我會很擔心,來了一個很熟悉的人我會比較放心,換一個人可能會比較擔心,有了這個平臺之后可以非常有信心的提供服務交付的一致度;從IT管理角度來看,資源管理的有序程度和透明化程度也會提高;并幫助逐步實現面向業務的管理。
增值業務平臺的云計算項目作為集團的試點項目而言,還可以看到更加多的現實意義。第一塊是他跨出這一步,IT團隊的領導說真正的改變服務的姿態,他們希望未來通過這些項目的實現,去改善他們對外服務的姿態和提升對內部業務單位用戶服務的能力,改善用戶服務的體驗。另外,用戶選型也選了非常長的時間,當時第一個思路希望看到越來越多的用戶已經做過了,他可以有更多服務案例去選;慢慢的,隨著溝通和分析的深入,用戶會看到,云計算平臺即使是復雜的,但平臺的構建都能基于現有的成熟技術和產品——包括設備的、虛擬化技術的以及管理技術的,每一塊組成部分都有理論和實踐上參考,因此用戶慢慢改觀想法,覺得自己可以去做嘗試,也認可通過建設可以積累更為具體和有指導意義的東西的思路;其實,很多用戶是相似的——在用戶真正走出這一步之前,任憑他去想都想不明白云計算具體是怎么樣的,會碰到什么樣的挑戰,需要通過什么方式克服,能夠帶來怎樣的收益——所以他希望在小范圍去做這樣的一個嘗試。大家知道,包括移動在內的國內的運營商都在考慮公有云的建設,但把云計算作為內部IT支持這一塊,浙江移動的網絡不是集團內走出具體的第一步的,這在移動集團內部有非常好的反響,也有一些其他省市移動單位也在之后跟我們接洽,討論建設類似平臺,改善內部IT管理的可能性。最后一點,用戶自己的感觸,建設和設計到最后,其實回歸本原,其實做所有東西是提升IT管理的成熟度,提升IT管理的水平,所以說,云計算建設,尤其是私有云計算平臺的建設,往往是提升內部IT管理成熟度的催化劑。
這是我們從用戶角度看BMC解決方案和大體項目的內容。謝謝各位。