聊聊 top 命令中的 CPU 使用率
平常我們使用 top 命令來(lái)查看系統(tǒng)的性能情況,在 top 命令中可以看到很多不同類(lèi)型的 CPU 使用率,如下圖紅框中標(biāo)出部分:
下面,我們來(lái)介紹一下這些 CPU 使用率的意義:
- us:user time,表示 CPU 執(zhí)行用戶(hù)進(jìn)程的時(shí)間,包括 nice 時(shí)間。通常都是希望用戶(hù)空間CPU越高越好。
- sy:system time,表示 CPU 在內(nèi)核運(yùn)行的時(shí)間,包括 IRQ 和 softirq。系統(tǒng) CPU 占用越高,表明系統(tǒng)某部分存在瓶頸。通常這個(gè)值越低越好。
- ni:nice time,具有優(yōu)先級(jí)的用戶(hù)進(jìn)程執(zhí)行時(shí)占用的 CPU 利用率百分比。
- id:idle time,表示系統(tǒng)處于空閑期,等待進(jìn)程運(yùn)行。
- wa:waiting time,表示 CPU 在等待 IO 操作完成所花費(fèi)的時(shí)間。系統(tǒng)不應(yīng)該花費(fèi)大量的時(shí)間來(lái)等待 IO 操作,否則就說(shuō)明 IO 存在瓶頸。
- hi:hard IRQ time,表示系統(tǒng)處理硬中斷所花費(fèi)的時(shí)間。
- si:soft IRQ time,表示系統(tǒng)處理軟中斷所花費(fèi)的時(shí)間。
- st:steal time,被強(qiáng)制等待(involuntary wait)虛擬 CPU 的時(shí)間,此時(shí) Hypervisor 在為另一個(gè)虛擬處理器服務(wù)。
當(dāng)然,單靠上面的解釋來(lái)理解它們的意義還是比較困難的。所以,本文主要從源碼的角度來(lái)分析它們到底代表什么。
時(shí)鐘中斷
首先,我們要知道統(tǒng)計(jì) CPU 使用情況在什么地方執(zhí)行的。在分析之前,我們先來(lái)了解下 時(shí)鐘中斷:
時(shí)鐘中斷:是一種硬中斷,由時(shí)間硬件(系統(tǒng)定時(shí)器,一種可編程硬件)產(chǎn)生。當(dāng) CPU 接收到時(shí)鐘中斷信號(hào)后,會(huì)在處理完當(dāng)前指令后調(diào)用 時(shí)鐘中斷處理程序 來(lái)完成更新系統(tǒng)時(shí)間、執(zhí)行周期性任務(wù)等。
可以發(fā)現(xiàn),統(tǒng)計(jì) CPU 使用情況是在 時(shí)鐘中斷處理程序 中完成的。
每個(gè) CPU 的使用情況通過(guò) cpu_usage_stat 結(jié)構(gòu)來(lái)記錄,我們來(lái)看看其定義:
- struct cpu_usage_stat {
- cputime64_t user;
- cputime64_t nice;
- cputime64_t system;
- cputime64_t softirq;
- cputime64_t irq;
- cputime64_t idle;
- cputime64_t iowait;
- cputime64_t steal;
- cputime64_t guest;
- };
從 cpu_usage_stat 結(jié)構(gòu)的定義可以看出,其每個(gè)字段與 top 命令的 CPU 使用率類(lèi)型一一對(duì)應(yīng)。在內(nèi)核初始化時(shí),會(huì)為每個(gè) CPU 創(chuàng)建一個(gè) cpu_usage_stat 結(jié)構(gòu),用于統(tǒng)計(jì) CPU 的使用情況。
OK,現(xiàn)在我們來(lái)分析下內(nèi)核是怎么統(tǒng)計(jì) CPU 的使用情況的。
每次執(zhí)行 時(shí)鐘中斷處理程序 都會(huì)調(diào)用 account_process_tick 函數(shù)進(jìn)行 CPU 使用情況統(tǒng)計(jì),我們來(lái)分析一下 account_process_tick 函數(shù)的實(shí)現(xiàn):
- void account_process_tick(struct task_struct *p, int user_tick)
- {
- cputime_t one_jiffy_scaled = cputime_to_scaled(cputime_one_jiffy);
- struct rq *rq = this_rq();
- // 說(shuō)明:user_tick 變量標(biāo)識(shí)當(dāng)前是否處于執(zhí)行用戶(hù)應(yīng)用程序
- if (user_tick) {
- // 1. 如果 CPU 在執(zhí)行用戶(hù)程序, 那么調(diào)用 account_user_time 進(jìn)行統(tǒng)計(jì)
- account_user_time(p, cputime_one_jiffy, one_jiffy_scaled);
- } else if ((p != rq->idle) || (irq_count() != HARDIRQ_OFFSET)) {
- // 2. 如果 CPU 在執(zhí)行內(nèi)核代碼, 那么調(diào)用 account_system_time 進(jìn)行統(tǒng)計(jì)
- account_system_time(p, HARDIRQ_OFFSET, cputime_one_jiffy,
- one_jiffy_scaled);
- } else {
- // 3. 否則說(shuō)明 CPU 在執(zhí)行 idle 進(jìn)程(也就是處于空閑狀態(tài)), 那么調(diào)用 account_idle_time 進(jìn)行統(tǒng)計(jì)
- account_idle_time(cputime_one_jiffy);
- }
- }
account_process_tick 函數(shù)主要分 3 種情況進(jìn)行統(tǒng)計(jì),如下:
- 如果 CPU 在執(zhí)行用戶(hù)程序,那么調(diào)用 account_user_time 進(jìn)行統(tǒng)計(jì)。
- 如果 CPU 在執(zhí)行內(nèi)核代碼,那么調(diào)用 account_system_time 進(jìn)行統(tǒng)計(jì)。
- 否則說(shuō)明 CPU 在執(zhí)行 idle 進(jìn)程(也就是處于空閑狀態(tài)),那么調(diào)用 account_idle_time 進(jìn)行統(tǒng)計(jì)。
CPU 使用情況統(tǒng)計(jì)
下面我們分別對(duì)這 3 種統(tǒng)計(jì)進(jìn)行分析。
1. 統(tǒng)計(jì)用戶(hù)程序執(zhí)行時(shí)間
統(tǒng)計(jì)用戶(hù)程序的執(zhí)行時(shí)間是通過(guò) account_user_time 函數(shù)來(lái)完成的,我們來(lái)看看其實(shí)現(xiàn):
- void account_user_time(struct task_struct *p, cputime_t cputime,
- cputime_t cputime_scaled)
- {
- // 獲取 CPU 的統(tǒng)計(jì)結(jié)構(gòu)(每個(gè)CPU一個(gè) cpu_usage_stat 結(jié)構(gòu))
- struct cpu_usage_stat *cpustat = &kstat_this_cpu.cpustat;
- cputime64_t tmp;
- ...
- // 分 2 種情況統(tǒng)計(jì) CPU 的使用情況
- // 1. 如果進(jìn)程的 nice 值大于0, 那么將會(huì)統(tǒng)計(jì)到 nice 字段中
- // 2. 如果進(jìn)程的 nice 值小于等于0, 那么將會(huì)統(tǒng)計(jì)到 user 字段中
- if (TASK_NICE(p) > 0)
- cpustat->nice = cputime64_add(cpustat->nice, tmp);
- else
- cpustat->user = cputime64_add(cpustat->user, tmp);
- ...
- }
account_user_time 函數(shù)主要分兩種情況統(tǒng)計(jì):
- 如果進(jìn)程的 nice 值大于0,那么將會(huì)增加到 CPU 統(tǒng)計(jì)結(jié)構(gòu)的 nice 字段中。
- 如果進(jìn)程的 nice 值小于等于0,那么增加到 CPU 統(tǒng)計(jì)結(jié)構(gòu)的 user 字段中。
這里說(shuō)明一下進(jìn)程 nice 值的作用,nice 值越大,說(shuō)明進(jìn)程的優(yōu)先級(jí)越低。所以,nice 統(tǒng)計(jì)值主要用來(lái)統(tǒng)計(jì)低優(yōu)先級(jí)進(jìn)程的占使用 CPU 的情況。也說(shuō)明了,user 和 nice 統(tǒng)計(jì)值都屬于執(zhí)行用戶(hù)程序的 CPU 時(shí)間。
2. 統(tǒng)計(jì)內(nèi)核代碼執(zhí)行時(shí)間
如果在發(fā)生時(shí)鐘中斷前,CPU 處于內(nèi)核態(tài),也就是說(shuō)在執(zhí)行內(nèi)核代碼。那么將會(huì)調(diào)用 account_system_time 函數(shù)進(jìn)行統(tǒng)計(jì),account_system_time 函數(shù)實(shí)現(xiàn)如下:
- void account_system_time(struct task_struct *p, int hardirq_offset,
- cputime_t cputime, cputime_t cputime_scaled)
- {
- // 獲取 CPU 的統(tǒng)計(jì)結(jié)構(gòu)(每個(gè)CPU一個(gè) cpu_usage_stat 結(jié)構(gòu))
- struct cpu_usage_stat *cpustat = &kstat_this_cpu.cpustat;
- cputime64_t tmp;
- ...
- // 主要分 3 種情況進(jìn)行統(tǒng)計(jì)
- // 1. 如果當(dāng)前處于硬中斷執(zhí)行上下文, 那么統(tǒng)計(jì)到 irq 字段中
- // 2. 如果當(dāng)前處于軟中斷執(zhí)行上下文, 那么統(tǒng)計(jì)到 softirq 字段中
- // 3. 否則統(tǒng)計(jì)到 system 字段中
- if (hardirq_count() - hardirq_offset)
- cpustat->irq = cputime64_add(cpustat->irq, tmp);
- else if (softirq_count())
- cpustat->softirq = cputime64_add(cpustat->softirq, tmp);
- else
- cpustat->system = cputime64_add(cpustat->system, tmp);
- ...
- }
account_system_time 函數(shù)主要分 3 種情況進(jìn)行統(tǒng)計(jì):
- 如果當(dāng)前處于硬中斷執(zhí)行上下文,那么增加到 CPU 統(tǒng)計(jì)結(jié)構(gòu)的 irq 字段中。
- 如果當(dāng)前處于軟中斷執(zhí)行上下文,那么增加到 CPU 統(tǒng)計(jì)結(jié)構(gòu)的 softirq 字段中。
- 否則增加到 CPU 統(tǒng)計(jì)結(jié)構(gòu)的 system 字段中。
從上面代碼可以看出,irq 和 softirq 統(tǒng)計(jì)值也算是內(nèi)核代碼執(zhí)行時(shí)間。
3. idle 進(jìn)程執(zhí)行時(shí)間統(tǒng)計(jì)
當(dāng)系統(tǒng)中沒(méi)有可運(yùn)行的進(jìn)程時(shí),將會(huì)執(zhí)行 idle 進(jìn)程。也就是說(shuō),當(dāng)系統(tǒng)執(zhí)行 idle 進(jìn)程時(shí),表示系統(tǒng)正處于空閑狀態(tài)。
idle 進(jìn)程執(zhí)行時(shí)間統(tǒng)計(jì)由 account_idle_time 函數(shù)完成,其實(shí)現(xiàn)如下:
- void account_idle_time(cputime_t cputime)
- {
- struct cpu_usage_stat *cpustat = &kstat_this_cpu.cpustat;
- cputime64_t cputime64 = cputime_to_cputime64(cputime);
- struct rq *rq = this_rq();
- // 分 2 種情況統(tǒng)計(jì) CPU 的使用情況
- // 1. 如果系統(tǒng)有進(jìn)程正在等待 I/O 操作完成, 那么將統(tǒng)計(jì)到 iowait 字段中
- // 2. 否則將統(tǒng)計(jì)到 idle 字段中
- if (atomic_read(&rq->nr_iowait) > 0)
- cpustat->iowait = cputime64_add(cpustat->iowait, cputime64);
- else
- cpustat->idle = cputime64_add(cpustat->idle, cputime64);
- }
account_idle_time 函數(shù)也分兩種情況進(jìn)行統(tǒng)計(jì):
- 如果系統(tǒng)中有正在等待 I/O 操作完成的進(jìn)程,那么增加到 CPU 統(tǒng)計(jì)結(jié)構(gòu)的 iowait 字段中。
- 否則增加到 CPU 統(tǒng)計(jì)結(jié)構(gòu)的 idle 字段中。
從上面的分析可以看出,iowait 統(tǒng)計(jì)值也屬于空閑時(shí)間的一種。
top 命令的 CPU 使用率
通過(guò)源碼分析,我們知道 top 命令中 CPU 使用率各種類(lèi)型的意思,現(xiàn)在我們來(lái)介紹一下 top 命令是怎么計(jì)算各種類(lèi)型的 CPU 使用率。
要獲取各個(gè) CPU 的使用情況信息,可以通過(guò)讀取 /proc/stat 文件獲取,如下:
- [vagrant@localhost ~]$ cat /proc/stat
- cpu 245 10 1142 1097923 95 0 28 0 0 0
- cpu0 245 10 1142 1097923 95 0 28 0 0 0
- ...
上面的結(jié)果顯示了 CPU 的使用情況信息,第一行代表所有 CPU 的總和,而第二行開(kāi)始表示每個(gè) CPU 核心的使用情況信息。因?yàn)槲业碾娔X只有一個(gè)核,所以只有一條數(shù)據(jù)。
下面說(shuō)說(shuō)這些數(shù)據(jù)的意義,從第一個(gè)數(shù)值開(kāi)始分別代表:user ,nice,system,idle,iowait, irq,softirq,steal。
所以,top 命令的 CPU 使用率計(jì)算公式如下:
- CPU總時(shí)間 = user + nice + system + idle + wait + irq + softirq + steal
- %us = user / CPU總時(shí)間
- %ni = nice / CPU總時(shí)間
- %sy = system / CPU總時(shí)間
- %id = idel / CPU總時(shí)間
- %wa = wait / CPU總時(shí)間
- %hi = irq / CPU總時(shí)間
- %si = softirq / CPU總時(shí)間
- %st = steal / CPU總時(shí)間
嗯,看起來(lái)還是挺簡(jiǎn)單的。
總結(jié)
本文主要分析了 top 命令中的 CPU 使用率的意義和實(shí)現(xiàn)原理,希望通過(guò)本文,能夠幫助大家對(duì) top 命令有更深的認(rèn)識(shí)。