前端監控之性能與異常
作者:京東物流 李菲菲
1 前言
現有的大部分監控方案都是針對服務端的,而針對前端的監控很少,諸如線上頁面的白屏時間是多少、靜態資源的加載情況如何、接口請求耗時好久、什么時候掛掉了、為什么掛掉,這些都不清楚。
同時,在產品推廣過程中,經常需要統計頁面的使用情況及用戶行為,從而可以從運營和產品的角度去了解用戶群體,進而迭代升級產品,使其更加貼近用戶,為業務的擴展提供更多可能性。
因而,我們需要一個前端的頁面監控系統,持續監控和預警頁面性能的狀況,并且在發現瓶頸時用于指導優化工作。
2 前端監控目標
前端監控主要包含兩大塊:性能監控及異常監控
- 保證穩定性(異常監控)
錯誤監控包括 JavaScript 代碼錯誤,Promsie 錯誤,接口(XHR,fetch)錯誤,資源加載錯誤(script,link等)等,這些錯誤大多會導致頁面功能異常甚至白屏。 - 提升用戶體驗(性能監控)
性能監控包括頁面的加載時間,接口響應時間等,側面反應了用戶體驗的好壞。
3 性能監控
3.1 簡單描述頁面加載
簡單看一下,從輸入url到頁面加載完成的過程如下:
首先需要通過 DNS(域名解析系統)將 URL 解析為對應的 IP 地址,然后與這個 IP 地址確定的那臺服務器建立起 TCP 網絡連接,隨后我們向服務端拋出 HTTP 請求,服務端處理完我們的請求之后,把目標數據放在 HTTP 響應里返回給客戶端,拿到響應數據的瀏覽器就可以開始走一個渲染的流程。渲染完畢,頁面便呈現給了用戶。
我們可以將這個過程分為如下的過程片段:
- DNS 解析
- TCP 連接
- HTTP 請求拋出
- 服務端處理請求,HTTP 響應返回
- 瀏覽器拿到響應數據,解析響應內容,把解析的結果展示給用戶
3.2 從開發者角度,看頁面加載各階段
從輸入url到用戶可以使用頁面的全過程時間統計,會返回一個PerformanceTiming對象,單位均為毫秒。
關于performace,已經在《從前端角度淺談性能》中進行過介紹,,下面再強調一下:
各階段的性能耗時可以通過API:window.performance來獲取,對應的具體方法有:performance.timing、performance.getEntriesByType(‘resource’)、performance.navigation等。
如上,開發者可以通過performance中各階段的時間戳,分別獲取到 頁面各階段的性能指標,具體的個靜態資源的加載耗時、及 頁面是否重定向和重定向耗時。
按觸發順序排列所有屬性:
- navigationStart:在同一個瀏覽器上下文中,前一個網頁(與當前頁面不一定同域)unload 的時間戳,如果無前一個網頁 unload ,則與 fetchStart 值相等
- redirectStart:第一個 HTTP 重定向發生時的時間。有跳轉且是同域名內的重定向才算,否則值為 0
- unloadEventStart:前一個網頁(與當前頁面同域)unload 的時間戳,如果無前一個網頁 unload 或者前一個網頁與當前頁面不同域,則值為 0
- redirectEnd:最后一個 HTTP 重定向完成時的時間。有跳轉且是同域名內的重定向才算,否則值為 0
- unloadEventEnd:和 unloadEventStart 相對應,返回前一個網頁 unload 事件綁定的回調函數執行完畢的時間戳
- fetchStart:瀏覽器準備好使用 HTTP 請求抓取文檔的時間,這發生在檢查本地緩存之前
- domainLookupStart:DNS 域名查詢開始的時間,如果使用了本地緩存(即無 DNS 查詢)或持久連接,則與 fetchStart 值相等
- domainLookupEnd:DNS 域名查詢完成的時間,如果使用了本地緩存(即無 DNS 查詢)或持久連接,則與 fetchStart 值相等
- connectStart:HTTP(TCP) 開始建立連接的時間,如果是持久連接,則與 fetchStart 值相等,如果在傳輸層發生了錯誤且重新建立連接,則這里顯示的是新建立的連接開始的時間
- secureConnectionStart:HTTPS 連接開始的時間,如果不是安全連接,則值為 0
- connectEnd:HTTP(TCP) 完成建立連接的時間(完成握手),如果是持久連接,則與 fetchStart 值相等,如果在傳輸層發生了錯誤且重新建立連接,則這里顯示的是新建立的連接完成的時間
- requestStart:HTTP 請求讀取真實文檔開始的時間(完成建立連接),包括從本地讀取緩存,連接錯誤重連時,這里顯示的也是新建立連接的時間
- responseStart:HTTP 開始接收響應的時間(獲取到第一個字節),包括從本地讀取緩存
- responseEnd:HTTP 響應全部接收完成的時間(獲取到最后一個字節),包括從本地讀取緩存
- domLoading:開始解析渲染 DOM 樹的時間,此時 Document.readyState 變為 loading,并將拋出 readystatechange 相關事件
- domInteractive:完成解析 DOM 樹的時間,Document.readyState 變為 interactive,并將拋出 readystatechange 相關事件
- domContentLoadedEventStart:DOM 解析完成后,網頁內資源加載開始的時間,文檔發生 DOMContentLoaded事件的時間
- domContentLoadedEventEnd:DOM 解析完成后,網頁內資源加載完成的時間(如 JS 腳本加載執行完畢),文檔的DOMContentLoaded 事件的結束時間
- domComplete:DOM 樹解析完成,且資源也準備就緒的時間,Document.readyState 變為 complete,并將拋出 readystatechange 相關事件
- loadEventStart:load 事件發送給文檔,也即 load 回調函數開始執行的時間,如果沒有綁定 load 事件,值為 0
- loadEventEnd:load 事件的回調函數執行完畢的時間,如果沒有綁定 load 事件,值為 0
3.3 各階段性能的計算(自定義)
4 異常監控
前端需要監控的錯誤主要有兩類:
- Javascript錯誤(js錯誤、promise錯誤)
- 監聽error錯誤(資源加載錯誤)
4.1 console.error
4.2 error事件
通過對error事件的監聽,可以捕捉到 js語法 及 資源加載 的錯誤。根據 event.target.src / href 來判斷是否為資源加載錯誤。
4.3 Promise
5 總結
以上,通過簡單的js代碼,即可實現對頁面性能與異常的監控與數據上報,后續還需要相應具體的平臺匯總,及相應的業務所需數據(如PV、UV等)的計算,才能真正實現對產品的頁面數據呈現,用于業務擴展及宣導。
6 后續
上述代碼,實現了對頁面性能及異常的監控,但其實前端的監控還包括了請求接口的監控與埋點的實現,后續將陸續推出,敬請期待。