成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

聊一聊Linux內(nèi)核中Watchdog

系統(tǒng) Linux
某國(guó)中央銀行在一臺(tái)有 內(nèi)存4T, 320個(gè)cpu核 的Linux服務(wù)器上跑一個(gè)數(shù)據(jù)庫(kù)程序,數(shù)據(jù)庫(kù)上存有他本國(guó)所有人民的銀行賬號(hào)信息,當(dāng)此數(shù)據(jù)庫(kù)程序在運(yùn)行過程中,發(fā)生了IO讀寫錯(cuò)誤,或者程序bug, 一下卡住了,那么他本國(guó)人民就都不能存錢取錢轉(zhuǎn)賬了,整個(gè)國(guó)民經(jīng)濟(jì)瞬間癱瘓。

 [[373385]]

本文轉(zhuǎn)載自微信公眾號(hào)「相遇Linux」,可以通過以下二維碼關(guān)注。轉(zhuǎn)載本文請(qǐng)聯(lián)系相遇Linux公眾號(hào)。

在Linux內(nèi)核中有三個(gè)watchdog(看門狗),它們都需要被悉心的喂養(yǎng)照料,分別是:

1. /dev/watchdog

2.softlockup檢測(cè)機(jī)制

3.hardlockup檢測(cè)機(jī)制

首先看 1./dev/watchdog,此看門狗該怎樣喂養(yǎng)呢,linux內(nèi)核中有一段樣例代碼:

  1. samples/watchdog/watchdog-simple.c 
  2. // SPDX-License-Identifier: GPL-2.0 
  3. #include <stdio.h> 
  4. #include <stdlib.h> 
  5. #include <unistd.h> 
  6. #include <fcntl.h> 
  7.  
  8. int main(void) 
  9.         int fd = open("/dev/watchdog", O_WRONLY); 
  10.         int ret = 0; 
  11.         if (fd == -1) { 
  12.                 perror("watchdog"); 
  13.                 exit(EXIT_FAILURE); 
  14.         }    
  15.         while (1) { 
  16.                 ret = write(fd, "\0", 1);  
  17.                 if (ret != 1) { 
  18.                         ret = -1;  
  19.                         break; 
  20.                 }    
  21.                 sleep(10); 
  22.         }    
  23.         close(fd); 
  24.         return ret; 

此例子中,每隔10秒鐘就會(huì)向“/dev/watchdog" 文件寫入0, 這就是喂狗過程,看到這個(gè)樣例,好像不太能感受到這個(gè)看門狗大的用處,但是放在實(shí)際工程中,用處太大了,舉個(gè)例子:

某國(guó)中央銀行在一臺(tái)有 內(nèi)存4T, 320個(gè)cpu核 的Linux服務(wù)器上跑一個(gè)數(shù)據(jù)庫(kù)程序,數(shù)據(jù)庫(kù)上存有他本國(guó)所有人民的銀行賬號(hào)信息,當(dāng)此數(shù)據(jù)庫(kù)程序在運(yùn)行過程中,發(fā)生了IO讀寫錯(cuò)誤,或者程序bug, 一下卡住了,那么他本國(guó)人民就都不能存錢取錢轉(zhuǎn)賬了,整個(gè)國(guó)民經(jīng)濟(jì)瞬間癱瘓。

此時(shí)想想看,Linux系統(tǒng)有沒有什么機(jī)制來解決這種問題了,這時(shí)候“/dev/watchdog" 來了,

這個(gè)時(shí)候只需要在數(shù)據(jù)庫(kù)程序中加上類似上面的樣例程序,每隔10s中就去喂狗一次,

只要數(shù)據(jù)庫(kù)程序卡住,卡住之后就不能喂狗了,等到比如默認(rèn)60s以后,這只狗就罷工了,立馬會(huì)默認(rèn)觸發(fā)服務(wù)器重啟。

服務(wù)器重啟會(huì)重新加載數(shù)據(jù)庫(kù)程序, 或者服務(wù)器在重啟過程中,由于服務(wù)器與它所在的服務(wù)器集群失聯(lián),從而觸發(fā)集群中的分腦檢測(cè),把數(shù)據(jù)庫(kù)程序挪到集群中其它設(shè)備上跑, 此時(shí)就減少了很多損失. 所以這只狗/dev/watchdog 用處太大了。

再來看下它的實(shí)現(xiàn)原理:

  1. #ps -ef | grep watchdog 
  2. root       104     2  0  2020 ?        00:00:00 [watchdogd] 
  3.  
  4. #ls -l /dev/watchdog* 
  5. crw------- 1 root root  10, 130 Dec 30 20:04 /dev/watchdog 
  6. crw------- 1 root root 247,   0 Dec 30 20:04 /dev/watchdog0 

看到系統(tǒng)中有個(gè)內(nèi)核線程watchdogd, 和兩個(gè)字符文件:/dev/watchdog和/dev/watchdog0

其中watchdogd實(shí)時(shí)調(diào)度類線程負(fù)責(zé)具體執(zhí)行喂狗,/dev/watchdog是內(nèi)核提供給用戶層的通用操作接口文件,用來開啟這只狗,喂狗,查詢狀態(tài)等。/dev/watchdog0 是具體的狗子實(shí)現(xiàn),可以基于具體的物理設(shè)備實(shí)現(xiàn),或者是softdog內(nèi)核模塊以軟件的方式(具體使用方法:modprobe softdog)模擬硬件實(shí)現(xiàn)。

來看下softdog內(nèi)核模塊怎樣模擬硬件實(shí)現(xiàn)這個(gè)功能:

  1. static int __init softdog_init(void) 
  2.         hrtimer_init(&softdog_ticktock, CLOCK_MONOTONIC, HRTIMER_MODE_REL); 
  3.         softdog_ticktock.function = softdog_fire; 
  4.  
  5. static enum hrtimer_restart softdog_fire(struct hrtimer *timer) 
  6.         emergency_restart(); 
  7.  
  8. static int softdog_ping(struct watchdog_device *w) 
  9.         hrtimer_start(&softdog_ticktock, ktime_set(w->timeout, 0), (60s) 
  10.                       HRTIMER_MODE_REL); 

從代碼實(shí)現(xiàn)來看,很好理解,在開啟看門狗(open "/dev/watchdog")之后,默認(rèn)60s以后就會(huì)觸發(fā)系統(tǒng)重啟,在60s倒計(jì)時(shí)過程中,只有喂狗(softdog_ping)一次,它就又會(huì)恢復(fù)到60s以后才會(huì)觸發(fā)系統(tǒng)重啟,所以只要一直喂狗,emergency_restart()就不會(huì)執(zhí)行,系統(tǒng)就不會(huì)重啟。

再來看下 2.softlockup檢測(cè)機(jī)制 和 3.hardlockup檢測(cè)機(jī)制。

softlockup檢測(cè)機(jī)制的喂狗方式是,每cpu上的hrtimer會(huì)喚醒一個(gè)migration/N內(nèi)核線程,migration/N每次被喚醒之后都會(huì)對(duì)某個(gè)時(shí)間戳進(jìn)行重置。

hardlockup檢測(cè)機(jī)制的喂狗方式是,hrtimer每次執(zhí)行時(shí)都會(huì)對(duì)一個(gè)變量進(jìn)行加一。

關(guān)于softlockup和hardlockup檢測(cè)機(jī)制的具體原理實(shí)現(xiàn)和應(yīng)用場(chǎng)景,我最近發(fā)布了一個(gè)視頻“Linux常見鎖和lockup檢查機(jī)制" 包含了從實(shí)現(xiàn)原理(linux內(nèi)核代碼層)和原理驗(yàn)證(使用ftrace調(diào)試手段)、樣例代碼、動(dòng)手模擬實(shí)驗(yàn),可以全方位理解softlockup/hardlockup.

 

責(zé)任編輯:武曉燕 來源: 相遇Linux
相關(guān)推薦

2019-02-13 14:15:59

Linux版本Fedora

2020-06-28 09:30:37

Linux內(nèi)存操作系統(tǒng)

2023-12-14 11:35:32

.NET泄露模式

2019-03-20 14:29:46

Linux虛擬內(nèi)存

2020-12-11 11:11:44

原子類JavaCAS

2019-12-02 16:23:03

Python編程語言“垃圾”回收

2022-08-30 07:39:57

C++namespace隔離

2018-06-07 13:17:12

契約測(cè)試單元測(cè)試API測(cè)試

2023-09-22 17:36:37

2021-01-28 22:31:33

分組密碼算法

2020-05-22 08:16:07

PONGPONXG-PON

2024-03-08 09:51:12

Linux網(wǎng)絡(luò)性能

2021-06-30 07:19:35

微服務(wù)業(yè)務(wù)MySQL

2019-12-12 14:52:10

數(shù)據(jù)庫(kù)腳本

2022-11-09 08:05:15

JavaScriptsuper()

2022-03-06 20:35:41

并發(fā)串行CAP

2024-10-16 15:11:58

消息隊(duì)列系統(tǒng)設(shè)計(jì)

2020-08-12 08:34:16

開發(fā)安全We

2021-01-01 09:01:05

前端組件化設(shè)計(jì)

2022-11-26 00:00:06

裝飾者模式Component
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

主站蜘蛛池模板: 国产特级毛片 | 日韩欧美中文 | 玖玖精品| 91豆花视频 | 国产精品自拍视频网站 | 美女在线国产 | 久久噜噜噜精品国产亚洲综合 | 亚洲综合大片69999 | 免费精品视频一区 | 国产在线观看网站 | 国产激情视频 | 精品欧美一区二区精品久久久 | 久久久久亚洲 | 五月婷婷亚洲 | 色婷婷av777 av免费网站在线 | 日日综合 | 国产精品国产精品国产专区不卡 | 国产午夜一级 | 最新中文字幕久久 | 日韩欧美在线不卡 | 国产激情视频 | 中文字幕视频网 | 久久久久久久久久久蜜桃 | 久久综合久久久 | 中国人pornoxxx麻豆 | 午夜精品久久久久久久99黑人 | 91精品国产综合久久久久蜜臀 | 成人av免费看 | 久久久久久91 | 天天干b| 国产日韩91| 日韩中文字幕 | 性欧美精品一区二区三区在线播放 | 在线一区二区三区 | 国产精品久久久精品 | 日韩欧美在线播放 | 欧美在线观看一区 | 成人久久视频 | 国产一区二区三区四区在线观看 | 在线播放国产一区二区三区 | 九九视频在线观看视频6 |