四個(gè)令人意外的不可靠可觀測(cè)性的成本
有效的可觀測(cè)性可以減少業(yè)務(wù)中斷、故障排除時(shí)間和工程疲勞,同時(shí)提高客戶滿意度。
譯自4 Unexpected Costs of Unreliable Observability。作者Amanda Mitchell,Chronosphere的內(nèi)容營(yíng)銷(xiāo)高級(jí)經(jīng)理。Amanda有20多年為品牌和媒體創(chuàng)造數(shù)字內(nèi)容的編輯經(jīng)驗(yàn)。
有時(shí)候很難知道一個(gè)不利問(wèn)題可以給您的業(yè)務(wù)帶來(lái)多少成本 - 直到它發(fā)生。雖然您的組織可能已經(jīng)掌握了服務(wù)停機(jī)時(shí)間的測(cè)量 - 計(jì)算收入損失、客戶滿意度評(píng)分、客戶流失和負(fù)面新聞 - 您是否花時(shí)間來(lái)全面理解當(dāng)您的可觀測(cè)性平臺(tái)變慢或不可用時(shí)產(chǎn)生的全部業(yè)務(wù)成本?
當(dāng)您的可觀測(cè)性平臺(tái)無(wú)法正常工作時(shí),您的團(tuán)隊(duì)最終會(huì)盲目飛行,對(duì)您的服務(wù)沒(méi)有可見(jiàn)性。反過(guò)來(lái),您的業(yè)務(wù)可以快速經(jīng)歷業(yè)務(wù)和收入中斷、更長(zhǎng)的故障排除時(shí)間、增加的工程疲勞和客戶滿意度下降。
以下是您的業(yè)務(wù)需要知道的四大不可靠可觀測(cè)性工具的成本。
云原生是不同的
技術(shù)環(huán)境正在不斷發(fā)展。向云原生移動(dòng)允許您的業(yè)務(wù)在數(shù)字世界中保持高效和敏捷,在這個(gè)世界里,客戶希望快速交易和永不中斷的體驗(yàn)。您監(jiān)控環(huán)境的能力需要超過(guò)您的平臺(tái)的承諾。然而,傳統(tǒng)的基礎(chǔ)設(shè)施和監(jiān)控系統(tǒng) - 用于監(jiān)控部署在虛擬機(jī)(VM)上的單體應(yīng)用程序- 在滿足您和您的團(tuán)隊(duì)所需的可靠性和規(guī)模方面無(wú)法匹敵,無(wú)法在今天的數(shù)字業(yè)務(wù)世界中脫穎而出。
業(yè)務(wù)和收入中斷
即使您的應(yīng)用程序還在運(yùn)行,當(dāng)您的可觀測(cè)性平臺(tái)關(guān)閉時(shí),您也無(wú)法完全經(jīng)營(yíng)您的業(yè)務(wù)。例如,當(dāng)可觀測(cè)性停止時(shí),審計(jì)跟蹤可能中斷。這意味著在可觀測(cè)性平臺(tái)恢復(fù)之前,您無(wú)法允許任何交易。當(dāng)可觀測(cè)性平臺(tái)不可用時(shí),您還可能需要告訴您的工程師停止部署。在這兩種情況下,不可靠的可觀測(cè)性工具都會(huì)耗費(fèi)您的時(shí)間和金錢(qián)。
更長(zhǎng)的故障排除時(shí)間
當(dāng)監(jiān)控和可觀測(cè)性平臺(tái)部分或完全停機(jī)時(shí),保持您的環(huán)境運(yùn)行需要相關(guān)的意外成本。故障排除時(shí)間更長(zhǎng),因?yàn)槟墓こ處熣谧粉檨?lái)自替代來(lái)源的可觀測(cè)數(shù)據(jù)。您最好的工程師被從其他重要任務(wù)中抽離出來(lái)幫助管理停機(jī)。此外,永久的數(shù)據(jù)丟失也不是不可能的,這可能意味著任何趨勢(shì)分析都存在丟失的數(shù)據(jù)。不可靠的可觀測(cè)性降低了對(duì)可觀測(cè)性工具的信心。開(kāi)發(fā)人員在推出新代碼時(shí)會(huì)猶豫 - 這會(huì)減慢部署和業(yè)務(wù)。
工程師疲勞
可觀測(cè)性停機(jī)時(shí)間的人為成本是真實(shí)的,導(dǎo)致疲勞,從而對(duì)您的收入和利潤(rùn)產(chǎn)生負(fù)面影響。修復(fù)停機(jī)問(wèn)題可能會(huì)導(dǎo)致加班加點(diǎn)、延長(zhǎng)的值班時(shí)間和日益增長(zhǎng)的挫敗感。由于疲勞,您的公司可能會(huì)失去最有價(jià)值的工程師,并且招聘新工程師一直是一個(gè)艱巨的挑戰(zhàn)。此外,根據(jù)Chronosphere的2023年云原生可觀測(cè)性報(bào)告,工程師花25%的時(shí)間(近一個(gè)工作日的時(shí)間)用于故障排除,疲勞問(wèn)題普遍存在。
客戶滿意度
客戶不滿可能是不可靠可觀測(cè)性最明顯的成本。今天的客戶很聰明、不耐煩并有很高的期望 - 性能稍有下降就可能導(dǎo)致他們放棄搜索、請(qǐng)求或交易 - 導(dǎo)致收入損失。在2023年在線可靠性報(bào)告中,75%的受訪者表示頻繁的減速或故障會(huì)導(dǎo)致他們停止使用某個(gè)應(yīng)用程序或網(wǎng)站。當(dāng)您的可觀測(cè)性解決方案速度變慢或不可用時(shí),您可能會(huì)錯(cuò)過(guò)影響客戶的問(wèn)題。客戶體驗(yàn)的關(guān)鍵是滿足服務(wù)級(jí)別協(xié)議(SLA),但根據(jù)2023年云原生可觀測(cè)性報(bào)告,99%的工程師表示他們未能達(dá)到平均修復(fù)時(shí)間目標(biāo)。
如何提高可觀測(cè)性投資回報(bào)率(ROI)
最近的一份Forrester Research報(bào)告顯示,可靠的可觀測(cè)性解決方案每年可以減少75%的嚴(yán)重事件。Chronosphere是一個(gè)單租戶、基于SaaS的云原生可觀測(cè)性平臺(tái),它提供99.9%的服務(wù)級(jí)別協(xié)議(SLA),但在過(guò)去一年中,它為所有客戶提供了99.99%的服務(wù)。
與傳統(tǒng)的基礎(chǔ)設(shè)施和監(jiān)控工具相比,Chronosphere將正確的數(shù)據(jù)置于上下文中,允許您的工程師快速解決問(wèn)題。這意味著組織可以消除業(yè)務(wù)和收入中斷、減少故障排除時(shí)間、減少工程師疲勞,同時(shí)提高客戶滿意度。
計(jì)算使用Chronosphere云原生可觀測(cè)性的投資回報(bào)率。