網(wǎng)絡(luò)可觀察性的3個優(yōu)秀做法
網(wǎng)絡(luò)可觀察性是開發(fā)網(wǎng)絡(luò)智能的重要方法,但很多網(wǎng)絡(luò)團隊沒有使用這種方法。
觀察網(wǎng)絡(luò)可能會顯著提高企業(yè)網(wǎng)絡(luò)運營 (NetOps) 的成功率。企業(yè)團隊可以采取幾個步驟來實現(xiàn)網(wǎng)絡(luò)可觀察性,這樣做將使網(wǎng)絡(luò)管理員能夠更好地了解他們的網(wǎng)絡(luò),并保證為其最終用戶提供足夠的服務(wù)。
什么是網(wǎng)絡(luò)可觀察性?
當(dāng)團隊監(jiān)控網(wǎng)絡(luò)時,他們會關(guān)注網(wǎng)絡(luò)的性能。如果網(wǎng)絡(luò)中出現(xiàn)問題,通過監(jiān)控,網(wǎng)絡(luò)管理員能夠檢測到問題。雖然團隊能夠通過管理和監(jiān)控解決網(wǎng)絡(luò)問題,但網(wǎng)絡(luò)可觀察性可以提供對網(wǎng)絡(luò)更徹底的評估。當(dāng)團隊觀察網(wǎng)絡(luò)時,他們的目標(biāo)是了解問題如何發(fā)生、如何糾正問題以及如何改進網(wǎng)絡(luò),以防止未來發(fā)生錯誤。
軟件工程咨詢公司Data Ductus的首席技術(shù)官Göran Edin在最近的網(wǎng)絡(luò)研討會上說,網(wǎng)絡(luò)可觀察性也可以定義為“在盡可能短的時間內(nèi),解決重建最終用戶體驗狀態(tài)變量的問題-對比測量到的狀態(tài)變量”。
Edin的定義是對Rudolf Kalman對控制系統(tǒng)可觀察性定義的修正,他列出以下原則,企業(yè)可用于使其網(wǎng)絡(luò)服務(wù)具有可觀察性:
- 衡量最終用戶體驗;
- 使用遙測方法來收集數(shù)據(jù);
- 提供服務(wù)保證,確保為客戶提供優(yōu)質(zhì)服務(wù)。
1. 關(guān)注最終用戶體驗
研究表明,衡量最終用戶體驗具有積極影響。根據(jù)Enterprise Management Associates對2020年網(wǎng)絡(luò)管理大趨勢進行的研究表明,三分之一的IT問題由最終用戶報告,然后NetOps團隊才檢測到這些問題。在受訪者中,那些衡量和監(jiān)控最終用戶體驗的企業(yè),運營更為成功。
雖然這些統(tǒng)計數(shù)據(jù)強調(diào)網(wǎng)絡(luò)監(jiān)控的重要性,但觀察最終用戶體驗可以提供有關(guān)如何改進網(wǎng)絡(luò)的更有價值的信息。Edin說,監(jiān)控網(wǎng)絡(luò)只能讓團隊收集有關(guān)網(wǎng)絡(luò)的信息,這“還不夠”。
網(wǎng)絡(luò)專家應(yīng)該觀察網(wǎng)絡(luò),以獲得洞察力,并創(chuàng)建數(shù)據(jù)驅(qū)動系統(tǒng)來做出最適合網(wǎng)絡(luò)發(fā)展的決策。隨著越來越多的應(yīng)用程序遷移到云端,或演變成復(fù)雜的分布式系統(tǒng),企業(yè)投資于基于最終用戶體驗的可觀察性系統(tǒng)可以簡化NetOps管理。Edin說,理想情況下,該系統(tǒng)應(yīng)該能夠預(yù)測潛在問題、模擬場景,并推薦網(wǎng)絡(luò)改進。
2. 使用遙測方法用于NetOps
網(wǎng)絡(luò)專業(yè)人員需要收集足夠的數(shù)據(jù)來創(chuàng)建系統(tǒng),以使他們的網(wǎng)絡(luò)服務(wù)可被觀察。他們必須使用最相關(guān)的遙測方法來收集數(shù)據(jù),以監(jiān)控和觀察網(wǎng)絡(luò)服務(wù)。現(xiàn)在有多種遙測方法,但與網(wǎng)絡(luò)監(jiān)控最相關(guān)的類型是數(shù)據(jù)配置、合成數(shù)據(jù)和設(shè)備遙測。
- 數(shù)據(jù)配置是網(wǎng)絡(luò)管理員選擇數(shù)據(jù)來代表操作意圖。發(fā)現(xiàn)操作意圖是邁向基于意圖的網(wǎng)絡(luò)的一步,它可以讓網(wǎng)絡(luò)專業(yè)人員了解他們的網(wǎng)絡(luò)行為。Edin說,根據(jù)他的經(jīng)驗,網(wǎng)絡(luò)專業(yè)人員很難在不知道操作意圖的情況下監(jiān)控最終用戶服務(wù)。
- 合成數(shù)據(jù)使團隊能夠使用合成流量進行測試以模擬最終用戶體驗,Edin稱,這是他們最接近模擬最終用戶體驗的方法。模仿用戶交互讓管理員可以評估用戶如何與網(wǎng)絡(luò)互動。
- 設(shè)備遙測是管理員使用指標(biāo)來檢查網(wǎng)絡(luò)狀態(tài)。根據(jù)Edin的說法,對于團隊來說,當(dāng)與合成數(shù)據(jù)結(jié)合使用時,這種遙測形式是有價值的數(shù)據(jù)收集工具,因為這可以確定問題的根本原因。
雖然這些方法對于收集數(shù)據(jù)很有用,但它們主要用于監(jiān)控網(wǎng)絡(luò)。當(dāng)團隊想要提供服務(wù)保證時,它們變得更加相關(guān),因為這些數(shù)據(jù)可用于確定網(wǎng)絡(luò)是否正常運行以及其服務(wù)是否正常工作。
為了收集高質(zhì)量數(shù)據(jù),以用于網(wǎng)絡(luò)可觀察性,網(wǎng)絡(luò)團隊必須確保他們收集的數(shù)據(jù)具有相關(guān)性、連貫性、可訪問性、一致性且定義明確。通過高質(zhì)量數(shù)據(jù),他們可以識別哪些服務(wù)在他們的網(wǎng)絡(luò)中有效,哪些內(nèi)容需要改進以及如何部署任何修改。
3. 確保服務(wù)保證
Edin說,網(wǎng)絡(luò)可觀察性是服務(wù)保證過程的一部分。他補充說,當(dāng)使用監(jiān)控網(wǎng)絡(luò)的遙測方法構(gòu)建可觀察性平臺或系統(tǒng),團隊還應(yīng)該準(zhǔn)備好“數(shù)據(jù)預(yù)處理層”,可以“清理”從遙測方法收集的數(shù)據(jù)。此清理過程可確保數(shù)據(jù)的高質(zhì)量,以用于可觀察性平臺。
具有軟件能力的網(wǎng)絡(luò)團隊可以創(chuàng)建自己的數(shù)據(jù)預(yù)處理層或其他服務(wù)保障系統(tǒng)。他們還有機會使用5G來虛擬化基礎(chǔ)設(shè)施并,運行測試代理,以確認(rèn)網(wǎng)絡(luò)的高性能服務(wù)是否正在運行。盡管如此,可觀察性平臺最終必須為團隊生成相關(guān)數(shù)據(jù),以了解他們的網(wǎng)絡(luò),并為客戶提供服務(wù)保證。
Edin 說,服務(wù)保證也應(yīng)該是整個服務(wù)生命周期的一部分。
他指出:“這樣做不僅可以消除通過人工處理引入錯誤的風(fēng)險,還可以將交付速度從數(shù)周或數(shù)月縮短到至少數(shù)天”,并補充說加快流程也將降低勞動力成本。
整合可觀察性與DevOps
網(wǎng)絡(luò)團隊還可以按照Edin概述的相同步驟將服務(wù)保證納入DevOps流程。首先,他們應(yīng)該衡量最終用戶體驗。然后,他們可以確定有關(guān)他們網(wǎng)絡(luò)的問題,并需要相應(yīng)的答案。回答這些問題的簡單程度也有助于確定網(wǎng)絡(luò)的可觀察性。
網(wǎng)絡(luò)專業(yè)人員應(yīng)該使用最好的遙測方法來深入了解他們的網(wǎng)絡(luò)服務(wù),并創(chuàng)建他們的系統(tǒng)。Edin說他建議團隊從數(shù)據(jù)配置開始,以確定操作意圖。
他指出:“確保你有真實的來源,展示并告訴你有哪些服務(wù)。”
他接下來建議團隊使用設(shè)備和合成遙測,以連貫地解釋最終用戶體驗,并檢查系統(tǒng)資源是否成功。如果需要,團隊可以添加其他遙測方法。
最后,服務(wù)保證應(yīng)集成到網(wǎng)絡(luò)自動化中。應(yīng)根據(jù)需要,多次執(zhí)行、審查和重復(fù)整個過程。
隨著NetOps變得更加自動化,以及開發(fā)新服務(wù),團隊可能會改變其網(wǎng)絡(luò)的行為,從而改變最終用戶的體驗。Edin說,確保服務(wù)保證,以及服務(wù)生命周期的其他步驟,通過網(wǎng)絡(luò)可觀察性可以降低這種風(fēng)險。