利用運維工具破局!看招商銀行運維部門如何與開發、業務和睦相處
原創【51CTO.com原創稿件】當傳統銀行開始向互聯網金融轉型時,銀行不僅需要重塑自身形象,還要利用互聯網+的各種手段工具,成為更多金融服務的提供者。正所謂“打鐵還需自身硬”,傳統銀行的IT 架構和系統也亟需“蛻變”,承載更多業務價值,幫助業務部門構建更完善的數字生態系統。
招商銀行數據中心應用管理團隊負責人張建林日前和記者暢談了傳統金融IT非功能實踐的演變思路,他與記者分享了傳統金融在互聯金融趨勢下需求的演進,以及運維部門與其他開發部門、業務部門的聯動,以及在新興技術層出不窮的時代,該如何讓運維工作與時俱進,發揮更多價值。
傳統金融的四大挑戰
張建林將傳統金融對運維的挑戰分為四類:
首先是來自線上業務交易量的高速增長壓力,原有的組織架構已經無法滿足這樣的高交易量需求;
其次是運維部門和開發部門需要在工作中無縫對接,他告訴記者,由于政策要求,很多運維工作不能讓開發人員參與,開發跟運維有明確的分工界限。但對于高速迭代發展的互聯企業來說,如何讓這兩個部門實現無縫對接的監管尤為重要;
再者是運維人員的增長速度永遠跟不上開發和業務訴求的增長;
***是銀行監管部門與銀行客戶對于應用系統高可用的要求。這一點充分體現了金融行業的特殊性,不同于一般企業的高可用性,銀行的業務系統需要滿足銀監會、證監會的高標準,對數據的安全和交易的安全、可用性是需要首先考慮,其次是如何應對高并發的要求,這些都給銀行帶來了不小的挑戰。
運維工作也有壓力
在由聽云主辦的2017中國應用性能管理大會現場,張建林做了《傳統金融IT非功能實踐的演變思路》 演講,當記者問及什么是傳統金融“IT非功能”時,張建林解釋道,業務部門的需求叫功能需求,目的是實現某個業務需求。非功能需求,就是從運維角度提出的需求,主要是在完成業務功能的開發之外,為了實現該項目提出的訴求。他舉了一個例子,例如業務部門提出一個秒殺活動,那么開發部門的首要任務就是設計出滿足這個秒殺活動的程序,但是他們不會去考慮這個活動背后需要IT系統配備多少存儲、網絡、計算資源,是否需要做壓力測試,是否需要性能調優,這個秒殺活動的環境部署是怎樣的等等情況,而這些因素恰恰是運維部門需要考慮的。那么運維部門就會在代碼開發階段就提出IT非功能需求,要求開發部門如何配置數據庫,如何實現負載均衡匹配業務。確保開發與運維共同實現業務需求。
張建林指出,傳統業務部門與運維的溝通并不多,但是現在運維部門正在更積極地參與到業務部門的工作中來,他們會提前和業務部門達成共識,充分了解業務場景,從而對業務量有一個預估并判斷出性能瓶頸,提前做好環境部署,而不是等到業務量突增之后,再去拓帶寬買設備,避免被動的局面。
自力更生打破僵局
張建林表示,運維現在有兩大流派,一是DevOps,主張應用、運維跟開發是一體的,無縫接的,二是谷歌提出的SRE理念(Site Reliability Engineer),讓開發和運維做到工作上的配合,運維能提前介入項目開發,提前把能做好運維的一些想法或者是工具、腳本、接口,讓開發準備好。“我更贊同谷歌SRE的理念,在現實中更有可操作性。” 張建林坦言。
解決運維僵局的另一個利器是自動化。張建林表示,現在X86平臺下,不可能讓一個人去運維一兩千臺服務器,因此必須要通過自動化,讓開發代碼跟運維自動化做一個平滑的無縫對接。
記者了解到,在招商銀行,自動化工具都是運維團隊自主研發的,因為自主研發的自動化工具更符合招商銀行特有的應用、特有的環境、特有的人員配備。目前招商銀行的運維和數據中心部門利用這些工具,完全可以做好運維工作,并支持開發部門交付的應用,并且保障應用的高可用性。“自己才是最了解自己需求的人,做的工具才可能是最適合的。” 張建林表示,之前也有一些廠商愿意提供定制化的自動化產品,但是外部人員很難深入了解銀行的環境和業務,響應速度和力度都跟不上,產品迭代延續性也不太好,還容易造成浪費。這些通過自主研發自動化運維工具都可以有效彌補。
運維的下一站重心
在采訪***,張建林也談了他對于運維未來工作重心的看法,他認為有三個轉變:
首先是傳統金融機構也在逐漸向互聯網企業看齊,逐步加強了線上客戶行為數據的采集,去做大數據的分析與挖掘,從業務層面挖掘數據價值。而運維部門的責任就是給這些業務部門提供不同的一個數據來源和大數據的分析平臺。
另外一個很明顯的趨勢就是傳統金融的重心在逐漸從線下轉移到線上,但之前的應用架構跟容量的設計肯定不能滿足現在線上交易的需求與發展,尤其在高并發、高交易與高增長等方面,因此現在需要對之前舊的架構逐步做整改與遷移,主要通過對此類業務的應用解耦,與主機下移X86平臺來實現。
張建林表示數據中心未來還將加速對云平臺方面的建設與運維,目前已經將部分非核心業務在私有云上投產與運營,等各方面時機成熟后,將會把更多的業務遷移到云平臺部署。
APMCon2017
APMCon是由聽云、極客邦科技與InfoQ聯合主辦的全球高水準APM技術盛會,聚焦當前最為關鍵的移動端、Web端和Server端的性能監控和管理技術。整個會議包含智能運維、數據庫性能優化、移動性能優化、前端性能優化、業務數據實時分析和可視化、微服務與容器與CDN加速等話題。
APMCon內容源于實踐并面向社區,來自國內外的演講嘉賓依據熱點話題,面向5年以上的技術團隊負責人、中高級開發和運維人員、工程總監分享APM技術創新、趨勢和***實踐。
【51CTO原創稿件,合作站點轉載請注明原文作者和出處為51CTO.com】