Linux系統(tǒng)的服務(wù)器巡檢怎么做?一個(gè)服務(wù)器的快速巡檢思路,經(jīng)典
最近收到一個(gè)工作要求,讓我完成一個(gè)每天一次的Linux服務(wù)器巡檢工作(服務(wù)器的版本為紅帽6.4),不可以使用監(jiān)控軟件來(lái)操作。在這里,把我的巡檢過(guò)程和巡檢腳本放送給大家做一參考。
首先,巡檢內(nèi)容可以參考下表:

Linux服務(wù)器應(yīng)用巡檢
具體的巡檢內(nèi)容在這里做一說(shuō)明:
1、 CPU占用率
檢查腳本:top shift+m c
這里需要記錄的參數(shù)是?%us,建議稍等幾秒看下動(dòng)態(tài)變化再記錄。

cpu占用率
2、內(nèi)存使用率
檢查腳本:free-m /free -g

內(nèi)存使用率
這里重點(diǎn)需要看的是swap內(nèi)存是否被使用了,需要記錄的是第二行的第二個(gè),它和總內(nèi)存量的比值就是內(nèi)存的使用率。具體使用-m還是-g,就看服務(wù)器內(nèi)存大小了
3、硬盤(pán)使用率
檢查腳本:df

硬盤(pán)使用率
磁盤(pán)使用率看的就是磁盤(pán)使用率本身了,這里如果服務(wù)器下的應(yīng)用單獨(dú)使用了掛載的磁盤(pán),還需要單獨(dú)查看掛載磁盤(pán)的使用率
4、 I/O空閑
檢查腳本:iostat -xm

I/O空閑
需要記錄的值就是圖中紅色框住的,?%idle,這個(gè)就是I/O空閑 。這里可以使用iostat -xm 1,動(dòng)態(tài)查看多個(gè)值了之后取一個(gè)比較平均的。
5、應(yīng)用運(yùn)行狀況
查看應(yīng)用的頁(yè)面是否正常,用戶(hù)是否使用正常。
6、應(yīng)用服務(wù)狀態(tài)
檢查腳本:./應(yīng)用服務(wù) status
查看是否服務(wù)狀態(tài)為running。
7、應(yīng)用服務(wù)運(yùn)行日志是否有報(bào)錯(cuò)
檢查腳本:cat 應(yīng)用服務(wù)運(yùn)行日志| grep ERR
直觀查看應(yīng)用服務(wù)運(yùn)行的日志中是否有報(bào)錯(cuò),這里也可以直接打開(kāi)查看:
vim 應(yīng)用服務(wù)運(yùn)行日志
然后用“/ERR”查看報(bào)錯(cuò)
8、應(yīng)用內(nèi)容記錄日志是否有報(bào)錯(cuò)
檢查腳本:cat 應(yīng)用內(nèi)容記錄日志 grep ERR
9、數(shù)據(jù)文件大小
首先,打開(kāi)應(yīng)用數(shù)據(jù)文件所在的目錄,然后運(yùn)行:du -sh *
這里可以看到此目錄下所有文件的大小。
10、歸檔文件狀態(tài)
這個(gè)是我負(fù)責(zé)的應(yīng)用的一個(gè)特殊功能,可以歸檔,所有有這個(gè)需求,大家可以忽略。
11、備份執(zhí)行情況
在備份目錄下查看備份最新的日期是否最近。
以上內(nèi)容為日常的數(shù)據(jù)庫(kù)巡檢全部?jī)?nèi)容,希望對(duì)大家的工作有用!