成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

在傳統運維監控系統中加入新的預警能力

運維
不管如何設置,單指標告警總是不準確的,因為我們無法知道系統什么時候存在問題。我們以每秒邏輯讀這個指標來做些分析吧。每秒邏輯讀這個指標在二十年前監控Oracle數據庫是否存在把系統撐爆的風險是十分有效的,那時候的服務器的CPU資源總是最緊張的。

?傳統的運維監控系統是以基線為核心判斷系統是否存在某個問題并進行告警的。這種模式最大的問題就是基線如何設置十分困難,如果我們自己日常運維的系統,我們對基線十分了解,那么我們可以給出相對合理的基線,實現較為精準的告警。

不管如何設置,單指標告警總是不準確的,因為我們無法知道系統什么時候存在問題。我們以每秒邏輯讀這個指標來做些分析吧。每秒邏輯讀這個指標在二十年前監控Oracle數據庫是否存在把系統撐爆的風險是十分有效的,那時候的服務器的CPU資源總是最緊張的。當邏輯讀變得很高的時候,我們就需要告警讓DBA介入運維了。這時候殺掉幾個大查詢往往就能挽救系統。實際上現在很多國產、開源數據庫運維領域,這個指標異常的監測依然十分有效。

傳統的基線模式只能設置一個閾值來判斷邏輯讀是否異常,這個值往往會設置的不準。因此我們會考慮采取一種新的方式來設置這個告警規則。

[metric,2189030]/[metric hour avg,2189030]>[num,$1] &&
[metric,2189030]>[bsl upper,2189030]*[num,$2]

上面的表達式的含義是當邏輯讀是該指標最近一小時平均值的N倍,并超過基線預警高值的M倍的時候產生該指標的故障預警。這主要是為了避免設置不合理的閾值的時候產生閾值設置過高則有問題不報警,設置過低,則經常誤報的問題。我們不需要再給系統設置一個預警的實際閾值了,而是根據系統中計算的當前一小時平均值來做判斷。加上右面的這個條件是為了防止系統從閑時突然變忙碌時的一個臨界狀態。這個狀態往往是正常的。

通過這樣的改造之后,邏輯讀預警的誤報問題得到了很好的緩解,不過問題又來了。N值得設置依然十分具有挑戰性,設置的不合理依然會產生大量的誤報。如果DBA運維的系統十分有限,而且對系統的這些指標的波動情況十分了解,那么設置合理的N還是不難做到的,不過在我們的用戶中并不總是這樣,很多運維人員根本不知道該如何去設置這個參數。另外一方面,隨著運維壓力日益增大,一個DBA可能要監控上百個甚至數百個數據庫,每個數據庫都去這么玩,工作量太大了。

我們也一直想把異常檢測算法引入到故障模型中來,不過一直因為算力過大的問題,沒法大規模應用。自從考慮采用異常檢測指標化的策略后,這個問題才得到很好的解決。

圖片

對于指標通過計算趨勢將各種狀態轉化為數字,比如3代表某個指標急劇上升。那么我們就可以利用這個新的指標來完成對上面的哪個表達式的改造了。

圖片

新的故障模型倍定義為當每秒邏輯讀指標超過一個絕對大的值(比如1000萬、2000萬等),或者每秒邏輯讀指標急劇上升,并且每秒邏輯讀大于一個門檻值(比如50萬),則說明系統的應用可能存在一定的異常。這種異常很可能是應用負載過大,也可能是應用出現了BUG,或者某條關鍵SQL的執行計劃出現了問題。

可能有些朋友還是有些不解,這里不也存在兩個參數嗎,似乎這個表達式的設置和以前并沒啥不同,不同的系統這些參數如何設置呢。實際上這兩個參數是補充型的,第一個設置為一個絕對高值,是為了避免指標出現緩慢增長,累計達到了一個較高的值,這個值對于當前的硬件是致命的,因此比較容易設置,比如設置2路服務器為1000萬,4路服務器為2000萬,大體是能夠發揮作用的,而參數2是為了避免小負載波動的門檻值,比如從1000增長到20000,很可能被監測為急劇增長,不過這種增長對系統來說是沒有太大影響的,為了避免此類現象誤報,需要設置一個門檻,一般來說10萬,20萬就可以避免了,設置起來也相當容易。

圖片

經過改造后,一旦出現異常負載,系統就能夠很好的告警了,而那些容易誤報的情況也不會再出現了。而且這個故障模型可以適應于不同的應用系統,不同類型的負載,不需要做個性化的調整。對于我們目前運維大量的系統的DBA來說,就省了很多事。實際上只要在我們的普羅米修斯、Zabbix等系統中,將異常分析算法進行指標化改造,要想實現類似D-SMART中智能預警的功能也并不難。其重點是異常分析算法的設計與異常分析指標化的設計。?

責任編輯:武曉燕 來源: 白鱔的洞穴
相關推薦

2017-01-10 17:50:33

傳統 監控

2013-04-12 13:30:47

2020-12-30 08:09:46

運維Prometheus 監控

2016-12-13 13:15:49

運維

2020-12-29 10:45:22

運維Prometheus-監控

2011-03-21 14:43:42

2018-11-20 15:18:00

SDN傳統網絡網絡運維

2018-09-27 08:59:29

2017-04-26 09:40:00

2015-08-03 10:50:48

高能預警虛擬化運維

2013-09-13 16:15:29

柯旻運維云計算運維

2016-04-06 10:02:23

手機微博運維監控

2020-12-28 10:13:32

運維Prometheus監控

2014-07-22 10:06:43

運維監控虛擬化

2021-11-06 23:22:33

運維IT企業

2020-05-07 15:58:50

運維云計算運維傳統運維

2019-03-19 08:41:38

Linux運維變更

2016-05-05 14:20:50

運維互聯網運維IOE

2017-08-08 14:09:21

2011-01-05 15:39:44

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 亚洲一级av毛片 | 成人精品一区二区三区中文字幕 | 久久久黄色 | 亚洲一区二区av | 亚洲高清视频在线观看 | 国产成人一区在线 | 亚洲成人av一区二区 | www.亚洲| 巨大荫蒂视频欧美另类大 | 国产亚洲一区二区三区在线观看 | 91精品国产日韩91久久久久久 | 国产精品久久久久久久久免费丝袜 | 免费视频二区 | 国产激情一区二区三区 | 日韩在线播放网址 | 中文字幕欧美日韩 | 亚洲va国产日韩欧美精品色婷婷 | 欧美精品一区在线观看 | 日韩视频在线观看一区二区 | 人人精品 | 在线日韩精品视频 | 狠狠干综合视频 | 日韩精品视频在线观看一区二区三区 | 精品毛片在线观看 | 欧美视频精品 | 天天干天天爱天天爽 | 少妇精品久久久久久久久久 | 鲁大师一区影视 | www.99久久.com | 中文字幕 在线观看 | 一区二区免费 | 国产精品亚洲一区二区三区在线 | 日韩在线免费观看视频 | 久久亚洲国产精品日日av夜夜 | 五月天国产| 国产japanhdxxxx麻豆 | 一级黄色大片 | 中文字幕亚洲区一区二 | 特级黄色毛片 | 亚洲成人一区二区在线 | 色www精品视频在线观看 |