成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

<rt id="cc2ek"></rt>

<code id="cc2ek"><delect id="cc2ek"></delect></code><dl id="cc2ek"></dl>

<abbr id="cc2ek"></abbr>

<noscript id="cc2ek"><tr id="cc2ek"></tr></noscript>

<bdo id="cc2ek"><source id="cc2ek"></source></bdo>

<samp id="cc2ek"><input id="cc2ek"></input></samp>

<rt id="cc2ek"><acronym id="cc2ek"></acronym></rt>

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

賬號(hào)設(shè)置退出

CPU飆高，系統(tǒng)性能問(wèn)題如何排查？

作者：阿里技術(shù) 2020-09-29 07:59:22

開發(fā) 開發(fā)工具商務(wù)辦公

壓測(cè)時(shí)或多或少都收到過(guò)CPU或者Load高的告警，如果是單機(jī)偶發(fā)性的，經(jīng)常會(huì)認(rèn)為是“宿主機(jī)搶占導(dǎo)致的”，那事實(shí)是否真是如此呢?是什么引起了這些指標(biāo)的飆高?網(wǎng)絡(luò)、磁盤還是高并發(fā)?

壓測(cè)時(shí)或多或少都收到過(guò)CPU或者Load高的告警，如果是單機(jī)偶發(fā)性的，經(jīng)常會(huì)認(rèn)為是“宿主機(jī)搶占導(dǎo)致的”，那事實(shí)是否真是如此呢?是什么引起了這些指標(biāo)的飆高?網(wǎng)絡(luò)、磁盤還是高并發(fā)?有什么工具可以定位?TOP、PS還是vmstat?CPU高&Load高和CPU低&Load高，不同的表征又代表著什么?

一背景知識(shí)

LINUX進(jìn)程狀態(tài)

LINUX 2.6以后的內(nèi)核中，進(jìn)程一般存在7種基礎(chǔ)狀態(tài)：D-不可中斷睡眠、R-可執(zhí)行、S-可中斷睡眠、T-暫停態(tài)、t-跟蹤態(tài)、X-死亡態(tài)、Z-僵尸態(tài)，這幾種狀態(tài)在PS命令中有對(duì)應(yīng)解釋。

D (TASK_UNINTERRUPTIBLE)，不可中斷睡眠態(tài)。顧名思義，位于這種狀態(tài)的進(jìn)程處于睡眠中，并且不允許被其他進(jìn)程或中斷(異步信號(hào))打斷。因此這種狀態(tài)的進(jìn)程，是無(wú)法使用kill -9殺死的(kill也是一種信號(hào))，除非重啟系統(tǒng)(沒錯(cuò)，就是這么頭硬)。不過(guò)這種狀態(tài)一般由I/O等待(比如磁盤I/O、網(wǎng)絡(luò)I/O、外設(shè)I/O等)引起，出現(xiàn)時(shí)間非常短暫，大多很難被PS或者TOP命令捕獲(除非I/O HANG死)。SLEEP態(tài)進(jìn)程不會(huì)占用任何CPU資源。
R (TASK_RUNNING)，可執(zhí)行態(tài)。這種狀態(tài)的進(jìn)程都位于CPU的可執(zhí)行隊(duì)列中，正在運(yùn)行或者正在等待運(yùn)行，即不是在上班就是在上班的路上。
S (TASK_INTERRUPTIBLE)，可中斷睡眠態(tài)。不同于D，這種狀態(tài)的進(jìn)程雖然也處于睡眠中，但是是允許被中斷的。這種進(jìn)程一般在等待某事件的發(fā)生(比如socket連接、信號(hào)量等)，而被掛起。一旦這些時(shí)間完成，進(jìn)程將被喚醒轉(zhuǎn)為R態(tài)。如果不在高負(fù)載時(shí)期，系統(tǒng)中大部分進(jìn)程都處于S態(tài)。SLEEP態(tài)進(jìn)程不會(huì)占用任何CPU資源。
T&t (__TASK_STOPPED & __TASK_TRACED)，暫停or跟蹤態(tài)。這種兩種狀態(tài)的進(jìn)程都處于運(yùn)行停止的狀態(tài)。不同之處是暫停態(tài)一般由于收到SIGSTOP、SIGTSTP、SIGTTIN、SIGTTOUT四種信號(hào)被停止，而跟蹤態(tài)是由于進(jìn)程被另一個(gè)進(jìn)程跟蹤引起(比如gdb斷點(diǎn))。暫停態(tài)進(jìn)程會(huì)釋放所有占用資源。
Z (EXIT_ZOMBIE), 僵尸態(tài)。這種狀態(tài)的進(jìn)程實(shí)際上已經(jīng)結(jié)束了，但是父進(jìn)程還沒有回收它的資源(比如進(jìn)程的描述符、PID等)。僵尸態(tài)進(jìn)程會(huì)釋放除進(jìn)程入口之外的所有資源。
X (EXIT_DEAD), 死亡態(tài)。進(jìn)程的真正結(jié)束態(tài)，這種狀態(tài)一般在正常系統(tǒng)中捕獲不到。

Load Average & CPU使用率

談到系統(tǒng)性能，Load和CPU使用率是最直觀的兩個(gè)指標(biāo)，那么這兩個(gè)指標(biāo)是怎么被計(jì)算出來(lái)的呢?是否能互相等價(jià)呢?

Load Average

不少人都認(rèn)為，Load代表正在CPU上運(yùn)行&等待運(yùn)行的進(jìn)程數(shù)，即

但Linux系統(tǒng)中，這種描述并不完全準(zhǔn)確。

以下為L(zhǎng)inux內(nèi)核源碼中Load Average計(jì)算方法，可以看出來(lái)，因此除了可執(zhí)行態(tài)進(jìn)程，不可中斷睡眠態(tài)進(jìn)程也會(huì)被一起納入計(jì)算，即：

602staticunsignedlongcount_active_tasks(void) 
603 { 
604structtask_struct*p; 
605unsignedlongnr=0; 
606607read_lock(&tasklist_lock); 
608for_each_task(p) { 
609if ((p->state==TASK_RUNNING610 (p->state&TASK_UNINTERRUPTIBLE))) 
611nr+=FIXED_1; 
612 } 
613read_unlock(&tasklist_lock); 
614returnnr; 
615 } 
...... 
625staticinlinevoidcalc_load(unsignedlongticks) 
626 { 
627unsignedlongactive_tasks; /* fixed-point */628staticintcount=LOAD_FREQ; 
629630count-=ticks; 
631if (count<0) { 
632count+=LOAD_FREQ; 
633active_tasks=count_active_tasks(); 
634CALC_LOAD(avenrun[0], EXP_1, active_tasks); 
635CALC_LOAD(avenrun[1], EXP_5, active_tasks); 
636CALC_LOAD(avenrun[2], EXP_15, active_tasks); 
637 } 
638 }

在前文 Linux進(jìn)程狀態(tài) 中有提到過(guò)，不可中斷睡眠態(tài)的進(jìn)程(TASK_UNINTERRUTED)一般都在進(jìn)行I/O等待，比如磁盤、網(wǎng)絡(luò)或者其他外設(shè)等待。由此我們可以看出，Load Average在Linux中體現(xiàn)的是整體系統(tǒng)負(fù)載，即CPU負(fù)載 + Disk負(fù)載 + 網(wǎng)絡(luò)負(fù)載 + 其余外設(shè)負(fù)載，并不能完全等同于CPU使用率(這種情況只出現(xiàn)在Linux中，其余系統(tǒng)比如Unix，Load還是只代表CPU負(fù)載)。

CPU使用率

CPU的時(shí)間分片一般可分為4大類：用戶進(jìn)程運(yùn)行時(shí)間 - User Time, 系統(tǒng)內(nèi)核運(yùn)行時(shí)間 - System Time, 空閑時(shí)間 - Idle Time, 被搶占時(shí)間 - Steal Time。除了Idle Time外，其余時(shí)間CPU都處于工作運(yùn)行狀態(tài)。

通常而言，我們泛指的整體CPU使用率為User Time 和 Systime占比之和(例如tsar中CPU util)，即：

為了便于定位問(wèn)題，大多數(shù)性能統(tǒng)計(jì)工具都將這4類時(shí)間片進(jìn)一步細(xì)化成了8類，如下為TOP對(duì)CPU時(shí)間片的分類。

us：用戶進(jìn)程空間中未改變過(guò)優(yōu)先級(jí)的進(jìn)程占用CPU百分比
sy：內(nèi)核空間占用CPU百分比
ni：用戶進(jìn)程空間內(nèi)改變過(guò)優(yōu)先級(jí)的進(jìn)程占用CPU百分比
id：空閑時(shí)間百分比
wa：空閑&等待I/O的時(shí)間百分比
hi：硬中斷時(shí)間百分比
si：軟中斷時(shí)間百分比
st：虛擬化時(shí)被其余VM竊取時(shí)間百分比

這8類分片中，除wa和id外，其余分片CPU都處于工作態(tài)。

二資源&瓶頸分析

從上文我們了解到，Load Average和CPU使用率可被細(xì)分為不同的子域指標(biāo)，指向不同的資源瓶頸?？傮w來(lái)說(shuō)，指標(biāo)與資源瓶頸的對(duì)應(yīng)關(guān)系基本如下圖所示。

Load高 & CPU高

這是我們最常遇到的一類情況，即load上漲是CPU負(fù)載上升導(dǎo)致。根據(jù)CPU具體資源分配表現(xiàn)，可分為以下幾類：

CPU sys高

這種情況CPU主要開銷在于系統(tǒng)內(nèi)核，可進(jìn)一步查看上下文切換情況。

如果非自愿上下文切換較多，說(shuō)明CPU搶占較為激烈，大量進(jìn)程由于時(shí)間片已到等原因，被系統(tǒng)強(qiáng)制調(diào)度，進(jìn)而發(fā)生的上下文切換。
如果自愿上下文切換較多，說(shuō)明可能存在I/O、內(nèi)存等系統(tǒng)資源瓶頸，大量進(jìn)程無(wú)法獲取所需資源，導(dǎo)致的上下文切換。

CPU si高

這種情況CPU大量消耗在軟中斷，可進(jìn)一步查看軟中斷類型。一般而言，網(wǎng)絡(luò)I/O或者線程調(diào)度引起軟中斷最為常見：

NET_TX & NET_RX。NET_TX是發(fā)送網(wǎng)絡(luò)數(shù)據(jù)包的軟中斷，NET_RX是接收網(wǎng)絡(luò)數(shù)據(jù)包的軟中斷，這兩種類型的軟中斷較高時(shí)，系統(tǒng)存在網(wǎng)絡(luò)I/O瓶頸可能性較大。
SCHED。SCHED為進(jìn)程調(diào)度以及負(fù)載均衡引起的中斷，這種中斷出現(xiàn)較多時(shí)，系統(tǒng)存在較多進(jìn)程切換，一般與非自愿上下文切換高同時(shí)出現(xiàn)，可能存在CPU瓶頸。

CPU us高

這種情況說(shuō)明資源主要消耗在應(yīng)用進(jìn)程，可能引發(fā)的原因有以下幾類：

死循環(huán)或代碼中存在CPU密集計(jì)算。這種情況多核CPU us會(huì)同時(shí)上漲。
內(nèi)存問(wèn)題，導(dǎo)致大量FULLGC，阻塞線程。這種情況一般只有一核CPU us上漲。
資源等待造成線程池滿，連帶引發(fā)CPU上漲。這種情況下，線程池滿等異常會(huì)同時(shí)出現(xiàn)。

Load高 & CPU低

這種情況出現(xiàn)的根本原因在于不可中斷睡眠態(tài)(TASK_UNINTERRUPTIBLE)進(jìn)程數(shù)較多，即CPU負(fù)載不高，但I(xiàn)/O負(fù)載較高。可進(jìn)一步定位是磁盤I/O還是網(wǎng)絡(luò)I/O導(dǎo)致。

三排查策略

利用現(xiàn)有常用的工具，我們常用的排查策略基本如下圖所示：

從問(wèn)題發(fā)現(xiàn)到最終定位，基本可分為四個(gè)階段：

資源瓶頸定位

這一階段通過(guò)全局性能檢測(cè)工具，初步定位資源消耗異常位點(diǎn)。

常用的工具有：

top、vmstat、tsar(歷史)
- 中斷：/proc/softirqs、/proc/interrupts
- I/O：iostat、dstat

熱點(diǎn)進(jìn)程定位

定位到資源瓶頸后，可進(jìn)一步分析具體進(jìn)程資源消耗情況，找到熱點(diǎn)進(jìn)程。

常用工具有：

上下文切換：pidstat -w
CPU：pidstat -u
I/O：iotop、pidstat -d
僵尸進(jìn)程：ps

線程&進(jìn)程內(nèi)部資源定位

找到具體進(jìn)程后，可細(xì)化分析進(jìn)程內(nèi)部資源開銷情況。

常用工具有：

上下文切換：pidstat -w -p [pid]
CPU：pidstat -u -p [pid]
I/O: lsof

熱點(diǎn)事件&方法分析

獲取到熱點(diǎn)線程后，我們可用trace或者dump工具，將線程反向關(guān)聯(lián)，將問(wèn)題范圍定位到具體方法&堆棧。

常用的工具有：

perf：Linux自帶性能分析工具，功能類似hotmethod，基于事件采樣原理，以性能事件為基礎(chǔ)，支持針對(duì)處理器相關(guān)性能指標(biāo)與操作系統(tǒng)相關(guān)性能指標(biāo)的性能剖析。
jstack
- 結(jié)合ps -Lp或者pidstat -p一起使用，可初步定位熱點(diǎn)線程。
- 結(jié)合zprofile-threaddump一起使用，可統(tǒng)計(jì)線程分布、等鎖情況，常用與線程數(shù)增加分析。
strace：跟蹤進(jìn)程執(zhí)行時(shí)的系統(tǒng)調(diào)用和所接收的信號(hào)。
tcpdump：抓包分析，常用于網(wǎng)絡(luò)I/O瓶頸定位。

相關(guān)閱讀

[1]Linux Load Averages: Solving the Mystery

http://www.brendangregg.com/blog/2017-08-08/linux-load-averages.html

[2]What exactly is a load average?

http://linuxtechsupport.blogspot.com/2008/10/what-exactly-is-load-average.html

責(zé)任編輯：武曉燕來(lái)源： 51CTO專欄

CPU 系統(tǒng)性能

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營(yíng)

主站蜘蛛池模板：欧美精品久久久 | 不卡一区二区三区四区 | 美女日批免费视频 | 午夜电影福利 | 成人在线播放网站 | 91亚洲精选 | 国产黑丝av | 亚洲国产欧美在线 | 一区二区三区在线免费观看 | 91欧美 | 亚洲一区二区三区四区五区午夜 | 国产精品精品久久久 | 男女搞网站 | 国产日韩精品在线 | 日本在线视频不卡 | 不用播放器看的av | 国产精品久久久久久二区 | www.一区二区三区 | 欧美日韩专区 | 欧美午夜一区 | 国产精品亚洲一区二区三区在线观看 | 精品久久影院 | 国产亚洲高清视频 | www.天天干.com| 五月天天丁香婷婷在线中 | 亚洲欧美一区二区三区情侣bbw | 国产精品久久av | 国产激情福利 | 日韩一区二区免费视频 | 一级毛片视频免费观看 | 一区二区三区高清不卡 | 亚洲国产精品99久久久久久久久 | 成人精品免费 | 国产精品精品久久久 | 亚洲中文欧美日韩在线观看 | 超碰在线人人 | 色噜噜色综合 | 91精品国产日韩91久久久久久 | 91久久 | 久久久久久国产精品久久 | 国际精品久久 |

<button id="42qma"></button>

<dl id="42qma"></dl>

<dl id="42qma"><acronym id="42qma"></acronym></dl><li id="42qma"></li>