專訪博睿孟曦東:“主動式”APM更貼近中國本土需求
原創2015:APM的中國元年
眾所周知,大數據、云計算、Web 2.0等社交媒體技術的發展,以及電子商務、網絡、零售商的繁榮,為APM帶來了前所未有的挑戰和機遇。
其實早在2008年,國外很多互聯網化的企業就已經開始使用APM解決方案,它并不是一個新的概念。那為什么在中國到了2015年,才讓大家一下子感覺到APM進入人們的視野,并受到業界的普遍關注呢?APM對企業的運維和管理到底有什么改變?
帶著這些問題,51CTO記者對北京博睿宏遠科技發展有限公司的CTO孟曦東進行專訪。下面就讓我們共同跟著孟總,來一一解開這些謎團。
博睿董事兼CTO 孟曦東
孟曦東,博睿創始人、博睿董事兼CTO,全面負責博睿的戰略規劃和運營管理。2008年1月,孟曦東離開千龍創建了博睿。經過七年多的發展,博睿已經發展成為國內AMP應用性能管理的領路先鋒。
為什么需要APM
首先從管理角度來看。技術部門在所有公司里都是最后一道防線。一個公司的技術部門有研發、運維、前端開發等不同的模塊,當問題出現時,比如用戶無法訪問,基本都先找運維。但很多問題其實跟運維沒有關系,這不僅延長了整個問題的解決周期,甚至有擴大問題嚴重程度的可能性。
孟曦東告訴我們,雖然企業都會有多套監控系統對業務做監控。但基本是介于防火墻內的監測,這是一種“自下而上”的解決方案,我們所有的監控系統都是認為保障了主機的構建以后,整個系統就是好的。但它不能直接獲得由真實客戶訪問時產生的數據。實際網絡的狀況遠比我們想象的復雜,這也使監測到的數據和真實客戶訪問數據間存在著差異。
APM之所以可以解決問題,是因為它將以往解決問題的方式從“經驗主義”,變成真正在用數據說話。APM將業務運營性能的波動變成可以量化的數據,客觀地反應我們的技術水平,從而幫助運維人員明確地知道,到底哪些地方出了問題,而不是揣測,大大提升解決問題的效率。
從運營角度來講也有好處。孟曦東將APM的作用形容為“開源節流”。通過APM提供的數據,運營人員可以清楚地知道自己真實客戶支持訪問情況怎么樣,從而判斷現在的產品到哪些區域的客戶沒有問題。至少在做宣傳、活動之前先測試一下在這些區域里你的訪問是否有問題,才能不花冤枉錢,這對運營很有幫助,而且對應用的業務推廣效率有更高的保證。
APM可以幫助進行競品分析。我們做什么都會有競爭對手,博睿當然需要知道競爭對手現在是一個什么樣的情況。孟曦東介紹到,通過APM的數據可以知道很多技術層面的數據,比如說CDN的使用情況、機房的規模和位置等,我們都可以看清楚技術整個情況,這對我們來講很有價值。
綜上所述, APM不只是簡單地為技術人員提供管理工具,而是對整個互聯網業務形態都有很好地促進。無論從技術運營、產品運營,到整個體系里面,每個環節的工作都會有更好的效果來呈現出來。
既然APM解決方案有這么多優勢,為什么至少現在,我們還沒有看到它被國人普遍接受呢?說到這里,孟曦東為我們提到了APM的“主動式與被動式”的概念。
#p#
主動式與被動式:APM的兩種模型
我們應該怎么理解APM的主動式與被動式呢?孟曦東具體講到,被動式可以理解為“侵入式”,相應地主動式對應著“非侵入式”。
我們目前看到的APM解決方案,大多都是被動式的,也就是侵入式的,就是要在你的服務器上裝東西,在你的系統里裝東西,也就是我們了解的“探針”。這種方式的優勢是當問題出現時,能夠及時發現,并進行問題的定位。這種方式在國外接受起來比較容易,但至少現在,中國人的思想還沒有如此開放,只關注到“探針”裝在我的機器上會不會有風險?這個風險可能來自于各種各樣層面的風險,所以接受起來還是比較困難的。另外,它需要對方的技術人員配合,把相應的程序植入你才能做性能數據的收集。而主動式監測可以在生產環境下有條不紊的查找分析問題,有效應用優化。而被動式監測所能發現的問題,往往隱藏在生產環境中,只有到特定應用組合觸發或用戶訪問行為集中時才會暴露。
正是看到了這些方面,博睿決定專注于主動式的APM領域。孟曦東認為,這其實是一種理念上的更新,因為主動式的APM解決問題是從上往下看,更輕更快。舉例來說,當用戶訪問一個網站時,不管底層是怎么樣,只要說網站在被認為合理的時間內正常打開,就認為它沒有問題,如果它打開慢了,就認為它有問題。這與用戶的體驗是一樣的。所以說主動式的APM離用戶確實最近,它收集的是來自最真實的用戶的數據。
但是在定位問題的時候可能會陷入到一個誤區里面,或者在一個黑盒里面,因為我沒有在你服務器上裝東西,所以我不知道你服務器具體那時候什么樣。因此主動式在定位問題的時候,是以“塊”來定位,而不是以“點”。但這種監測方式更容易讓現有國內技術領域客戶接受。
但這并不代表會影響對問題的監測和解決。孟曦東生動地舉例說明,“這就像我們做驗血一樣,要看你監測到多細,每一種都有類似替代的方式。這是要看你具體是想知道外面用戶真實的訪問體驗是什么樣?還想知道我所支撐應用的代碼運行是什么樣?看他想最終達到什么效果,改為定位有什么不一樣。你可以很簡單透過一個數據來這個東西,也可以非常復雜地看這個東西”。
對于如何判斷一款應用好的好壞,博睿有以下幾個主要的指標。第一是訪問的可用性;第二是傳輸速度或整體耗時;另外還會看一些技術型的指標,比如響應耗時,連接耗時等。每個技術對后端來看代表不同的系統,假如說連接耗時可能跟網絡、服務器資源有關,響應耗時跟代碼質量和服務器有關。通過這些“塊”問題的定位,來有效診斷出問題發生的位置。
孟曦東和博睿之所以專注于做主動式的APM,與他們明確的市場定位息息相關。博睿前期將整個客戶受眾定位于塔尖客戶,這些客戶對自己的業務數據和系統非常敏感,甚至我們在幫助客戶定位故障和應用優化時,客戶都不愿意將一些應用衍生數據進行只針對我們開放,沒有內外部數據的匯總就降低了定位問題的效率,所以客戶更不太可能接受被動式的APM方案。
另外,博睿在大數據方面的技術非常專業。主動式的APM,就是通過數據來診斷問題,對于數據的準確性要求很高。大數據技術可以進行很好的數據清洗而且還可以計算出更多有價值的信息,像博睿有一款產品,可以把中國整個網絡監控數據匯成網絡地圖 ,可以實時知道中國整個網絡擁塞情況的產品,根本不可能靠原來的數據庫來實現。如果沒有大數據的技術,這個平臺支撐起來是非常困難的,無法給客戶以更有價值的數據。非常可貴的一點是,博睿更開放。通過博睿主動式的平臺,他們可以有更多其他維度的數據,比如哪個城市、哪個省的網民用3G上網質量最好,這些數據可能對某些其他行業會有意義,他將這部分數據開放出來,給其他人創造便利。如果同行業者或產業鏈中的上下游之間能夠開放出更多公用監測數據,我們APM的產業價值將更加可觀。
未來APM市場的發展趨勢
隨著移動互聯網的火爆,創業團隊如雨后春筍般涌現,相信也會有更多的創業團隊加入到APM的領域當中。另外,PaaS的發展也同樣給APM市場帶來了更大的發展空間。對于未來APM市場的發展趨勢,孟曦東有著自己獨到的見解。
“我是歡迎能有更多的公司來做,這個行業里的公司越多,才能證明這個行業產業規模”。對于新的競爭者出現的問題,孟曦東表示出歡迎態度的同時,展現出了對博睿在APM 領域中的競爭優勢的信心。他提到由于APM技術門檻相對來講比較高,特別是對于主動式APM,不僅需要長期通過實踐來驗證服務質量,還需要具備相當強大的企業實力,因為主動式最頭疼的就是要在全國范圍內部署監測網絡,及對監測網絡的動態運營及任務調度等。這是很大的門檻。這也是博睿在APM領域中的最核心的競爭優勢。
“APM的市場是非常巨大的,我們還是希望有更多的創業團隊進入到這個市場,來共同促進領域的發展”。