Linux Shell腳本執(zhí)行超時怎么辦?
在shell里會有一種不太常見的情況,就是腳本有時候會出現(xiàn)超時的現(xiàn)象。一般來說遇到這種問題,我們都會簡單粗暴的采用下面這種腳本來當(dāng)“超時看門狗“:
這個腳本搭配兩個變量使用的話,監(jiān)控一點小代碼還算OK,但是它的邏輯還是比較粗糙,比如如果在這個腳本執(zhí)行的時候,又有了一個新的process在后臺啟動,那么kill掉的就是新的process,而本應(yīng)該停止的腳本還是在后臺肆無忌憚的跑著。
為了不濫殺無辜,所以遇到這種情況,就要使用timeout命令,具體的用法請自行#man timeout,這個命令在centos 6里就是自帶的。
假設(shè)我們要ping www.baidu.com ,同時要求“若超過了5秒沒有反應(yīng),就停止這個任務(wù)”。那么就是用命令:#timeout 5s ping www.baidu.com,效果如圖:
從26秒到31秒,的確達到了5秒就跳出的效果。
牛刀小試結(jié)束,那么現(xiàn)在我們就來進化一下我們之前的那個MQ腳本,之前在 http://chenx1242.blog.51cto.com/10430133/1884415 里我曾經(jīng)寫過一個MQ腳本,但是那個MQ腳本有點理想化了,里面忘記了添加“超時監(jiān)控”以及“重啟失敗的話會發(fā)郵件提醒運維人員”這兩個功能,在這里我們就把上面兩個短板補齊。
首先,我們先運行一下看看這個MQ看門狗腳本需要運行的時間:
從上面可見整個腳本運行大約需要13秒,那么我們考慮到其他因素設(shè)定超時時間為20秒,執(zhí)行效果如圖:
返回碼是0,那么再看看如果因為超時而停止的返回碼是多少呢?
可見由于超時停止的返回碼是124(ctrl+c手動退出的返回碼是130),那么整個腳本就很好寫了,如下:
然后在crontab里直接執(zhí)行這個腳本就好了。
補充說明之一,在文中測試timeout命令的時候,我使用了ping,其實這個是不嚴(yán)謹(jǐn)?shù)模驗閡nix的ping默認(rèn)會***重復(fù),所以#timeout 3s ping www.baidu.com 不管有沒有網(wǎng)絡(luò)連接都會超時。這里***的例子是看看#timeout 3s sleep 1和#timeout 3s sleep 5的區(qū)別。
補充說明之二,在shell腳本里,timeout后面若跟函數(shù)的話是無效的!