聽云雙十一重保服務 為應用性能帶來實時監控保護
原創【51CTO.com原創稿件】 臨近雙十一,所有的電商網站都在緊鑼密鼓的籌備和宣傳,對于雙十一當天自家網絡承載能力的預估,也成了電商公司技術部門最為棘手的問題。日前,擁有11年應用性能管理經驗的APM廠商-聽云在公司總部召開媒體溝通會,與來訪的媒體代表深入交流了雙十一期間,聽云推出的重保服務方案。51CTO有幸到場聆聽了聽云技術支持總監谷岳靜女士的講解和演示,了解到雙十一當天,確保網絡系統順暢運行的"秘密"。
雙十一電商面臨的挑戰
谷岳靜向媒體表示,雙十一電商網站面臨的挑戰非常大,每一家電商在雙十一都會面臨非常大的流量峰值,在這一天的流量峰值我們是想象不到的,要提前預估在那天有多少的流量,提前做多少帶寬的冗余,多少服務器的冗余來保障雙十一的需求。
另一個挑戰是最近幾年,基本上用戶都會轉到移動端上面來,比如京東,有60%~70%的用戶在移動端上,聚美幾乎有90%的用戶都是移動端。所以說最近幾年,對這些用戶來說,一個很大的挑戰是終端設備的復雜以及網絡接入方式的復雜。以前就是移動電信聯通這些,但是現在就有了3G、4G和各種各樣的介入方式,接入方式越多,對于后端技術的不可控程度也就越高。終端設備方面,近年來移動端的發展,僅安卓在全球的獨立機型就有五萬多種,對于他們來說要了解每一個用戶的使用習慣是一個非常大的挑戰。
第三點是交易額高,京東雙十一或者618當天的銷售額可能會相當于他們往常一個月甚至兩個月的銷售額。另外用戶體驗對于銷售額的影響也是非常大的,比如說網站如果斷了一秒,就這一秒就可以造成幾百萬甚至上千萬的損失,所以說就在活動當天,他們對于用戶體驗的要求是非常高的。
第四點數字化轉換營銷成功率的壓力非常大,臨近雙十一,我們在地鐵、App等等各種媒體渠道上都可以看到非常多的電商網站在打廣告,那么這個廣告能不能成功的轉化對于技術人員的壓力也是非常大的一個點。
電商技術部門的四點訴求
"針對于上述的挑戰,技術部門也會有一些訴求。"谷岳靜告訴大家。
***個訴求是在大促前進行現網環境的壓力測試,一般情況下都是做一些內網環境下的壓測,但是內網環境下的測試只是模擬請求?,F網環境就是真實用戶的測試,通過真實的測試來預估服務器的擴容。
第二個訴求,現在需要一套終端用戶時時監控系統,用來監視用戶端的,因為技術部門一開始只是針對服務器監控,但是這遠遠不夠。因為有數據指出,在性能問題中有70%的問題來自于用戶端,服務器端的問題只占大約30%。比如用戶點擊App的一個按鈕無響應,通常情況下這是無法反映到服務器中去的,現在就需要有一套用戶端的監控系統。
第三個訴求:用戶需要一套工具,即出現問題時,可以有一套工具來快速告訴我們問題點出現在哪里,并由誰來解決,讓這一套工具來很好的界定影響范圍。
第四個訴求,說到大促就不得不提CDN,因為在大促的過程中,每一家電商自己機房的帶寬肯定是滿足不了需求的,一定需要CDN來幫助自己做帶寬上的補充。CDN是一個黑盒式的服務,對于用戶來說,要想知道用戶端的用戶體驗好不好,就一定要監控到第三方服務商,也就是CDN廠商的每一個節點是不是在正常運作,因為CDN上的每一個節點出問題,都會影響到用戶所在地的一個省或者周邊省份的訪問情況。所以對于技術部門來說,需要一套工具來把CDN的質量透明化,把CDN每一個節點的數據都量化出來,這樣哪里有問題就可以快速的找CDN去解決。
聽云工作人員在大屏幕上實時監控用戶流量情況
聽云重保服務為雙十一保駕護航
對于每一個電商企業的技術部門來說,雙十一當天***的訴求是:可以沒有驚喜,但絕對不能出事。萬一有緊急情況發生,就要快速定位問題根源,因為每一分鐘的影響都是幾百萬的損失。另外當發現問題的時候就要精準的定位這個問題是由研發解決、運維來解決或是第三方來解決。這就是防出事并如何快速定位解決問題。
保障方案方面,聽云根據訴求,幫助電商企業做到防出事,幫他做快速的定位,當出現問題的時候就要他協調以達到快速解決的目的,最終減少對用戶、對品牌的影響。在雙十一當天,聽云會根據客戶的要求,提供技術人員駐場服務。聽云會將客戶的業務數據實時展現在大屏中,直觀的反饋網絡的承載情況。
怎么做到防出事,聽云首先會給客戶提供一套以用戶為中心的保障方案,最開始的時候電商企業的監控,都是從數據中心內部出發來監控。可能數據中心內部的安全性能達到很高的分值,但是用戶卻還在投訴。所以現在越來越多的電商企業開始關注用戶端的數據,我們把整個方案分成用戶端、網絡層和后端。
用戶端方面,針對于APP,聽云是讓客戶在APP中集成一條SDK,從而獲取所有的真實用戶訪問體驗數據,比如說訪問卡頓,點擊時轉圈或閃退等等,App端的數據我們是通過這種方式采集的。針對于瀏覽器端,我們是在客戶的頁面中插入JS,來獲取最近一段時間用戶訪問頁面的次數、哪個頁面首屏的白屏很長等等,針對于這些數據來進行針對性優化。
網絡層方面,聽云在全國有30萬個真實網民,讓這些網民模擬其用戶進行訪問從而獲得撥測訪問的性能數據;到了數據中心內部,也就是后端,聽云通過在應用服務器上部署探針的方式來獲取每一行代碼的執行效率,以及其服務器硬件的數據。所以說聽云為用戶提供了一套以用戶為中心的解決方案,將用戶的數據按業務維度全部建立起來,當出問題的時候,在這一整套平臺中可以實現端到端的溯源,比如前端有個接口很慢,聽云可以通過前瞻分析,用上百種指標來供客戶詳細分析錯誤原因以及責任界定。
第二個防出事的方法是,聽云幫助電商企業做現網環境的壓測,做到真實用戶的端到端的壓測方案。具體怎么實現呢?聽云在全國有30萬的真實網民,調用這些網民用戶來實時的對服務器發起并發訪問,在后端上部署探針,從而可以看到當大流量過來的時候其后端代碼執行效率的變化,看瓶頸點在哪里,再進行針對性的優化。這里舉個例子,比如在網上買東西,流程是打開頁面,搜索,到商品頁出來很多的商品列表,加入購物車,登錄,訂單支付…大概是這樣的一個流程,聽云會針對于這類的業務流程來進行監測,比如一開始的時候先是100個用戶訪問過來,之后沒過5分鐘就增加100個用戶,隨著時間的推移,用戶量則會越來越大,從而看出瓶頸點是在哪里。
大促當天,聽云要把客戶所有關鍵的業務接口全部監控起來,比如加入購物車按鈕、產品分類、搜索、登錄等等,將這些全部梳理出來,變被動為主動,按照業務維度進行監控。以前的監控都是從數據中心內部發起的監控,比如我某一個服務器的CPU高了,服務器的磁盤滿了,都是這類的維度。但是這些原因用戶是感知不到的,用戶能感知到的就是點擊這個按鈕不管用,又或者某個頁面打不開了,這才是用戶能夠理解的語言。所以說我們做的事情,就是按照業務維度進行報警,從而更快的知道錯誤點在哪,從而變被動為主動。
雙十一對于電商之重,重如泰山。聽云在APM領域的經驗告訴我們,只有提前現網壓測,當天實時監控,才能切實為用戶企業保駕護航。在雙十一的驚人數字背后,無不滲透著電商技術部門和第三方技術部門的良苦心血,讓我們共同期待2017雙十一的到來,期待著電商網絡為我們的生活帶來更多的便利和驚喜。就讓聽云為電商網絡的驚喜保駕護航吧!
【51CTO原創稿件,合作站點轉載請注明原文作者和出處為51CTO.com】