SREcon:聽云吳靜濤談最好的移動用戶體驗
備受矚目的年度國際***運維專家盛會SREcon今年來到了亞洲,于當地時間5月22日-24日在新加坡舉行。SREcon是由計算機科學領域的知名機構USENIX主辦,Google、Facebook等硅谷互聯網巨頭聯合成立的運維專家會議,每年定期舉行,聚集了關注網站可靠性、系統工程、以及復雜分布式系統相關的技術人員。
以批判性思考、技術深度剖析、持續改進以及創新為主旨的SREcon吸引了來自Google、Facebook、Twitter、 LinkedIn、Dropbox、 Netflix、 Pivotal、Pinterest、 Uber、 Twitter等國際知名互聯網公司的***專家,在現場分享了網站可靠性工程相關的議題,包含大規模網站可用性提升、資源優化及性能改善等話題。其中,國內領先的應用性能管理服務提供商聽云受邀出席了SREcon2017Asia/Australia,技術副總裁吳靜濤(Fred Wu)在現場與聽眾分享了《Good, Better, Best, Mobile user’sexperience》的話題。
聽云技術副總裁吳靜濤在場分享
現如今,移動應用更加垂直化、場景化。從辦公、居家再到商業,細化到旅行、運動、消費領域等每一個層面,都直指終端用戶。一款客戶端如何做到復雜但易于使用,強大但不復雜,在這其中用戶體驗變得尤為重要。傳統DC與云監控平臺更加關注高可用性,Restart—Reboot—Reimage是運維工程師***采取的三個動作。在如今的IT環境中,移動應用更多需要采用第三方監控平臺來幫助運維工程師清晰的了解應用運行狀態與實時用戶體驗,將DC的監測范圍擴大到移動用戶,從系統深入到對應用和代碼運行的監控,在出現問題的***時間進行定位與追蹤,保障用戶體驗。
以下為演講實錄(中文):
在中國,隨著Z代人逐漸成為市場消費的主力軍,移動互聯網開始大規模爆發并逐漸滲透入這一代人生活中,而Z代人,則是最為注重服務質量的一代人。也就是說,在中國的移動互聯網市場,如何保證用戶的體驗已經成為業務的核心。
[以用戶為中心的第三代平臺正在到來]
借用一個IDC報告,它提出了三個階段的連續性工業轉型:

***代平臺,即以計算為中心的工業平臺。
第二代平臺,以應用為中心。現在主流的IT企業都是以應用為中心的,也就是說,數據中心是以應用的可用性為***目標,它是以應用為中心構建自己的基礎設施,應用以及運維體系。
第三代平臺,不是以應用為中心,而是以用戶為中心。此時,就產生了非常大的沖突和改變的可能,結合近年來全球移動互聯網和云計算的爆發,以這兩者技術基礎的變更而產生了關聯為模型進行相關闡述,也就是說在未來的三到五年里在非常快速的全球的IT投資里,將會從以應用為中心慢慢轉向以用戶為中心。而以用戶為中心,就是用戶的體驗和感受如何。
企業的第二代平臺往往都是以應用為中心的,從數據中心是往外面做,為外面提供服務。而聽云的想法是以用戶為中心,從態勢感知發起,向數據中心內部發起。這樣就是一個顛覆性的不同點,也是聽云***的核心所在,也是這次聽云參加這次大會希望能夠傳達的全新的理念和技術解決方案的一個真實的想法和目標。
那么在移動互聯網大行其道的今天,從手機發起訪問開始到后端的DB回應為止,中間會涉及到多少個環節?答案是成百上千,在這其中有任何一個環節出現問題,都會造成用戶體驗下降。
通過下圖我們可以看到,移動終端用戶的80%~90%的時間都花在了前端,也就是說絕大多數用戶體驗的延遲或者用戶體驗的下降都發生在前端。而以前所構建的所有數據中心、基礎架構、運維方法全都是以應用可用性為主的,換句話說,很少去關心用戶端。

那么便會有這樣一個情況發生:數據中心訪問通了,用戶端訪問卻不好,在用戶投訴后,運維人員發現服務器正常、CPU正常、內存正常,加載正常,結果便是只能籠統地回復客戶正在排查,從而不了了之。
[新一代應用性能管理核心]
國際知名咨詢機構Gartner曾規范過下一代應用性能管理的核心,其認為在未來以云計算+智能終端的云端結構里面,傳統的運維應該慢慢的被拋棄掉,應該去發展成為一個以應用、用戶體驗為核心的新一代結構。

這里包含了三個主要的組件:
DEM,即用戶體驗的監控,包含:
Ø支持對操作體驗和數字化探針、人和機器的行為優化;
Ø與企業的應用和服務交互;
Ø包括基于網絡和移動端最終用戶的真實用戶監控(RUM)和綜合事務監控(STM)。
ADTD,即應用組件的深入理解、跟蹤和分析,談的是業務邏輯的自動拓撲,屬于監控的范疇,包含:
Ø了解服務端應用之間的關系,將事務映射到節點上,對方法和其他資源進行深度的檢查;
Ø這是一系列的過程,關注點在問題的修復,且是相互關聯的;
Ø包括應用程序拓撲發現和可視化,用戶定義的事務處理,應用組件的深度鉆取等。
AA,即應用分析,分析不同的語言和不同的系統間如何能夠做跟蹤,包含:
Ø機器學習、統計推斷和其他方法;
Ø自動檢測Java和.NET服務端應用支持的HTTP/S事務的性能異常的來源(或根本原因)
[五步實現NG-APM的全棧溯源,實現***移動用戶體驗]
對于傳統IT系統來說,體系結構設計和基礎設施設計時都會使用一套方法。即系統中有數據中心,無論它是虛擬化、云化還是傳統的大機,都會運用網絡運維、數據中心運維,并且都是通過客服來了解外部用戶使用體驗。
在過去,傳統企業往往以可用性為主去構建自己的數據中心,而在今天則應該走出數據中心,把用戶端接進來,把體驗監控做進來。在數據中心監控里面,不應該只監控到服務器,應該監控到業務邏輯以及監控到代碼運行效率,看到真實用戶的體驗不同。在這樣的大背景下,如何更快的找到性能問題并進行修復呢?

1、EUM,聽云用戶體驗評分系統

2、STM,交互性能分析

3、Network,網絡切片分析

4、Applicationtopology,應用拓撲展示

5、Codereview,代碼偏移量監控

[多維度實現新平臺轉型]
現在的企業在轉型第三代平臺的過程中,實際上是有可優化的方法和路徑的。依照聽云規范的下一代應用性能管理概念,需要利用一套新的方法去判斷真實的用戶體驗。首先,這就需要先對用戶實施監控,出現問題時能夠快速進行判斷和優化,這樣才能真的以用戶體驗為先去實施組織內部結構。其中,這個結構將會從三個維度組成,分別是Widen、Deepen和Auto。

Widen:
當企業內部結構是以用戶為中心的時候,這一套邏輯方法可以很好的去幫助實現優化。它實際上就是規范的DEM的過程,就是把用戶端的體驗包含在現有的數據中心的監控范圍之內,去擴展現有數據中心的監控廣度。
Deepen:
在廣度加強之后就要加強深度,實際上從深度的角度來講,對于數據中心的監控應該拋棄以前只監控到服務器和TCP端口的方法,需要真正考慮的是任何一個主要的應用過程應該包含有多少個環節、每個環節之間互相是怎樣的溝通關系、調用次數是多少、現在訪問體驗如何、如果出現了問題快速判斷問題在哪兒等,或者做到代碼級別的監控,以加深數據監控中心的深度。
Auto:
在聽云數據中心,每天會有200億條用戶體驗數據上傳上來。通過實際訪問的效果、可用性、延遲,甚至是訪問帶寬的價格去判斷應該從哪兒去訪問應用效果是***,成本是***,幫助去做外網用戶的智能路由的管理。
[好、更好、***的移動用戶體驗]
在移動互聯網時代,當前企業在構建未來的數據中心時,應該是以云端結構為基礎。但是在云端結構里面,不能以傳統的方法來進行數據中心監控。因為傳統的監控方法并不能監控外部用戶的體驗以及傳輸、代碼、真正的業務邏輯等。那么當以用戶為中心時,又應該如何去監控?移動互聯網發展到今天,已經給大家提出一個非常大的挑戰,這就是如何做下一代的架構,如何改變現狀。

聽云一直以來都在為客戶提供主動式服務,包括國內大事件、電商雙十一的駐場,特別突發事件的速度判斷,聽云都會提供專家級別的服務。在對于時間的追求上,聽云希望利用從客戶端到后臺全過程追查的全棧溯源的解決方案,能夠幫助傳統銀行業去打造一個秒極時代的用戶體驗,去應對互聯網,去應對云+智能終端的一個新環境。