成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

從 Kubectl Top 說(shuō)起, 淺談 Kubernetes 是如何進(jìn)行資源監(jiān)控的?

系統(tǒng) Linux
這篇文章會(huì)介紹其數(shù)據(jù)鏈路和實(shí)現(xiàn)原理,同時(shí)借 kubectl top 闡述 k8s 中的監(jiān)控體系,窺一斑而知全豹。

圖片

一. 前言

kubectl top 可以很方便地查看node、pod 的實(shí)時(shí)資源使用情況:如CPU、內(nèi)存。這篇文章會(huì)介紹其數(shù)據(jù)鏈路和實(shí)現(xiàn)原理,同時(shí)借 kubectl top 闡述 k8s 中的監(jiān)控體系,窺一斑而知全豹。最后會(huì)解釋常見(jiàn)的一些問(wèn)題:

  • kubectl top 為什么會(huì)報(bào)錯(cuò)?
  • kubectl top node 怎么計(jì)算,和節(jié)點(diǎn)上直接 top 有什么區(qū)別?
  • kubectl top pod 怎么計(jì)算,包含 pause 嗎?
  • kubectl top pod 和exec 進(jìn)入 pod 后看到的 top 不一樣?
  • kubectl top pod 和 docker stats得到的值為什么不同?

以下命令的運(yùn)行環(huán)境為:

  • k8s 1.8
  • k8s 1.13

二. 使用

kubectl top 是基礎(chǔ)命令,但是需要部署配套的組件才能獲取到監(jiān)控值

  • 1.8以下:部署 heapter
  • 1.8以上:部署 metric-server

kubectl top node: 查看node的使用情況

圖片

kubectl top pod: 查看 pod 的使用情況

圖片

不指定pod 名稱(chēng),則顯示命名空間下所有 pod,–containers可以顯示 pod 內(nèi)所有的container

圖片

指標(biāo)含義:

  • 和 k8s中 的 request、limit 一致,CPU單位100m=0.1 內(nèi)存單位1Mi=1024Ki
  • pod 的內(nèi)存值是其實(shí)際使用量,也是做 limit 限制時(shí)判斷 oom 的依據(jù)。pod的使用量等于其所有業(yè)務(wù)容器的總和,不包括 pause 容器,值等于 cadvisr中的 container_memory_working_set_bytes 指標(biāo)
  • node 的值并不等于該 node 上所有 pod 值的總和,也不等于直接在機(jī)器上運(yùn)行 top 或 free 看到的值

三. 實(shí)現(xiàn)原理

3.1 數(shù)據(jù)鏈路

kubectl top 、 k8s dashboard 以及 HPA 等調(diào)度組件使用的數(shù)據(jù)是一樣,數(shù)據(jù)鏈路如下:

圖片

使用 heapster 時(shí):apiserver 會(huì)直接將 metric 請(qǐng)求通過(guò) proxy 的方式轉(zhuǎn)發(fā)給集群內(nèi)的 hepaster 服務(wù)。

圖片

而使用 metrics-server 時(shí):apiserver 是通過(guò) /apis/metrics.k8s.io/ 的地址訪問(wèn) metric

圖片

這里可以對(duì)比下 kubect get pod 時(shí)的日志:

圖片

3.2 metric api

可以發(fā)現(xiàn),heapster 使用的是 proxy 轉(zhuǎn)發(fā),而 metric-server 和普通 pod都是使用 api/xx 的資源接口,heapster采用的這種 proxy 方式是有問(wèn)題的:

  • proxy 只是代理請(qǐng)求,一般用于問(wèn)題排查,不夠穩(wěn)定,且版本不可控
  • heapster 的接口不能像 apiserver 一樣有完整的鑒權(quán)以及 client 集成,兩邊都維護(hù)的話代價(jià)高,如 generic apiserver
  • pod 的監(jiān)控?cái)?shù)據(jù)是核心指標(biāo)(HPA調(diào)度),應(yīng)該和 pod 本身?yè)碛型鹊匚唬?metric 應(yīng)該作為一種資源存在,如 metrics.k8s.io 的形式,稱(chēng)之為 Metric Api

于是官方從 1.8 版本開(kāi)始逐步廢棄 heapster,并提出了上邊 Metric api 的概念,而 metrics-server 就是這種概念下官方的一種實(shí)現(xiàn),用于從 kubelet獲取指標(biāo),替換掉之前的 heapster

3.3 kube-aggregator

有了 metrics-server 組件,采集到了需要的數(shù)據(jù),也暴露了接口,但走到這一步和 heapster 其實(shí)沒(méi)有區(qū)別,最關(guān)鍵的一步就是如何將打到 apiserver的 ??/apis/metrics.k8s.io ??請(qǐng)求轉(zhuǎn)發(fā)給 metrics-server 組件?解決方案就是:kube-aggregator。kube-aggregator 是對(duì) apiserver 的有力擴(kuò)展,它允許 k8s 的開(kāi)發(fā)人員編寫(xiě)一個(gè)自己的服務(wù),并把這個(gè)服務(wù)注冊(cè)到 k8s 的 api 里面,即擴(kuò)展 API,metric-server 其實(shí)在 1.7版本就已經(jīng)完成了,只是在等 kube-aggregator 的出現(xiàn)。kube-aggregator 是 apiserver 中的實(shí)現(xiàn),有些 k8s 版本默認(rèn)沒(méi)開(kāi)啟,你可以加上這些配置來(lái)開(kāi)啟,他的核心功能是動(dòng)態(tài)注冊(cè)、發(fā)現(xiàn)匯總、安全代理

圖片

如 metric-server 注冊(cè) pod 和 node 時(shí):

圖片

3.4 監(jiān)控體系

在提出 metric api 的概念時(shí),官方也提出了新的監(jiān)控體系,監(jiān)控資源被分為了2種:

  • Core metrics(核心指標(biāo)):從 Kubelet、cAdvisor 等獲取度量數(shù)據(jù),再由metrics-server 提供給 Dashboard、HPA 控制器等使用。
  • Custom Metrics(自定義指標(biāo)):由 Prometheus Adapter 提供 API custom.metrics.k8s.io,由此可支持任意Prometheus采集到的指標(biāo)。

圖片

核心指標(biāo)只包含 node 和 pod 的 cpu、內(nèi)存等,一般來(lái)說(shuō),核心指標(biāo)作 HPA 已經(jīng)足夠,但如果想根據(jù)自定義指標(biāo):如請(qǐng)求 qps/5xx 錯(cuò)誤數(shù)來(lái)實(shí)現(xiàn) HPA,就需要使用自定義指標(biāo)了。目前 Kubernetes 中自定義指標(biāo)一般由 Prometheus 來(lái)提供,再利用 k8s-prometheus-adpater 聚合到 apiserver,實(shí)現(xiàn)和核心指標(biāo)同樣的效果。

3.5 kubelet

前面提到,無(wú)論是
heapster 還是 metric-server,都只是數(shù)據(jù)的中轉(zhuǎn)和聚合,兩者都是調(diào)用的 kubelet 的 api 接口獲取的數(shù)據(jù),而 kubelet 代碼中實(shí)際采集指標(biāo)的是 cadvisor 模塊,你可以在 node 節(jié)點(diǎn)訪問(wèn) 10255 端口(1.11版本過(guò)后是10250端口)獲取監(jiān)控?cái)?shù)據(jù):

  • Kubelet Summary metrics: 127.0.0.1:10255/metrics,暴露 node、pod 匯總數(shù)據(jù)
  • Cadvisor metrics: 127.0.0.1:10255/metrics/cadvisor,暴露 container 維度數(shù)據(jù)

示例,容器的內(nèi)存使用量:

圖片

Kubelet 雖然提供了 metric 接口,但實(shí)際監(jiān)控邏輯由內(nèi)置的 cAdvisor 模塊負(fù)責(zé),演變過(guò)程如下:

  • 從k8s 1.6開(kāi)始,kubernetes 將 cAdvisor 開(kāi)始集成在kubelet中,不需要單獨(dú)配置
  • 從k8s 1.7開(kāi)始,Kubelet metrics API 不再包含 cadvisor metrics,而是提供了一個(gè)獨(dú)立的 API 接口來(lái)做匯總
  • 從 k8s 1.12 開(kāi)始,cadvisor 監(jiān)聽(tīng)的端口在k8s中被刪除,所有監(jiān)控?cái)?shù)據(jù)統(tǒng)一由 Kubelet 的 API 提供

到這里為止,k8s 范圍內(nèi)的監(jiān)控體系就結(jié)束了。

3.6 cadvisor

cadvisor 由谷歌開(kāi)源,使用 Go 開(kāi)發(fā),cadvisor 不僅可以搜集一臺(tái)機(jī)器上所有運(yùn)行的容器信息,包括 CPU 使用情況、內(nèi)存使用情況、網(wǎng)絡(luò)吞吐量及文件系統(tǒng)使用情況,還提供基礎(chǔ)查詢界面和 http 接口,方便其他組件進(jìn)行數(shù)據(jù)抓取。在K8S 中集成在 Kubelet 里作為默認(rèn)啟動(dòng)項(xiàng),k8s 官方標(biāo)配。cadvisor 拿到的數(shù)據(jù)結(jié)構(gòu)示例:

圖片

核心邏輯是通過(guò) new 出來(lái)的 memoryStorage 以及 sysfs 實(shí)例,創(chuàng)建一個(gè)manager 實(shí)例,manager 的 interface 中定義了許多用于獲取容器和 machine 信息的函數(shù)

圖片

cadvisor的指標(biāo)解讀:cgroup-v1(https://www.kernel.org/doc/Documentation/cgroup-v1/memory.txt)

cadvisor 獲取指標(biāo)時(shí)實(shí)際調(diào)用的是 runc/libcontainer 庫(kù),而 libcontainer 是對(duì) cgroup 文件 的封裝,即 cadvsior 也只是個(gè)轉(zhuǎn)發(fā)者,它的數(shù)據(jù)來(lái)自于cgroup 文件。

3.7 cgroup

cgroup 文件中的值是監(jiān)控?cái)?shù)據(jù)的最終來(lái)源,如

  • mem usage 的值,來(lái)自于

    /sys/fs/cgroup/memory/docker/[containerId]/memory.usage_in_bytes

  • 如果沒(méi)限制內(nèi)存,Limit=machine_mem,否則來(lái)自于

    /sys/fs/cgroup/memory/docker/[id]/memory.limit_in_bytes

  • 內(nèi)存使用率=memory.usage_in_bytes/memory.limit_in_bytes

一般情況下,cgroup文件夾下的內(nèi)容包括CPU、內(nèi)存、磁盤(pán)、網(wǎng)絡(luò)等信息:

圖片圖片

如 memory 下的幾個(gè)常用的指標(biāo)含義:

圖片圖片

memory.stat 中的信息是最全的:

圖片

原理到這里結(jié)束,這里解釋下最開(kāi)始的 kubectl top 的幾個(gè)問(wèn)題:

四. 問(wèn)題

4.1 kubectl top 為什么會(huì)報(bào)錯(cuò)

一般情況下 top 報(bào)錯(cuò)有以下幾種,可以 kubectl top pod -v=10看到具體的調(diào)用日志:

  • 沒(méi)有部署 heapster 或者 metric-server,或者 pod 運(yùn)行異常,可以排查對(duì)應(yīng) pod 日志
  • 要看的 pod 剛剛建出來(lái),還沒(méi)來(lái)得及采集指標(biāo),報(bào) not found 錯(cuò)誤,默認(rèn) 1 分鐘
  • 以上兩種都不是,可以檢查下 kubelet 的 10255 端口是否開(kāi)放,默認(rèn)情況下會(huì)使用這個(gè)只讀端口獲取指標(biāo),也可以在 heapster 或 metric-server 的配置中增加證書(shū),換成 10250 認(rèn)證端口

4.2 kubectl top pod 內(nèi)存怎么計(jì)算,包含 pause容器嗎

每次啟動(dòng) pod,都會(huì)有一個(gè) pause 容器,既然是容器就一定有資源消耗(一般在 2-3M 的內(nèi)存),cgroup 文件中,業(yè)務(wù)容器和 pause 容器都在同一個(gè) pod的文件夾下。

但 cadvisor 在查詢 pod 的內(nèi)存使用量時(shí),是先獲取了 pod 下的container列表,再逐個(gè)獲取container的內(nèi)存占用,不過(guò)這里的 container 列表并沒(méi)有包含 pause,因此最終 top
pod 的結(jié)果也不包含 pause 容器pod 的內(nèi)存使用量計(jì)算kubectl top pod 得到的內(nèi)存使用量,并不是 cadvisor 中的 container_memory_usage_bytes,而是 container_memory_working_set_bytes,計(jì)算方式為:

  • container_memory_usage_bytes = container_memory_rss + container_memory_cache + kernel memory
  • container_memory_working_set_bytes = container_memory_usage_bytes – total_inactive_file(未激活的匿名緩存頁(yè))

container_memory_working_set_bytes 是容器真實(shí)使用的內(nèi)存量,也是 limit限制時(shí)的 oom 判斷依據(jù)。cadvisor 中的 container_memory_usage_bytes 對(duì)應(yīng) cgroup 中的 memory.usage_in_bytes 文件,但 container_memory_working_set_bytes 并沒(méi)有具體的文件,他的計(jì)算邏輯在 cadvisor 的代碼中,如下:


圖片

同理,node 的內(nèi)存使用量也是 container_memory_working_set_bytes。

4.3 kubectl top node 怎么計(jì)算,和節(jié)點(diǎn)上直接 top 有什么區(qū)別

kubectl top node 得到的 cpu 和內(nèi)存值,并不是節(jié)點(diǎn)上所有 pod 的總和,不要直接相加。top node 是機(jī)器上 cgroup 根目錄下的匯總統(tǒng)計(jì)圖片

圖片

在機(jī)器上直接 top 命令看到的值和 kubectl top node 不能直接對(duì)比,因?yàn)橛?jì)算邏輯不同,如內(nèi)存,大致的對(duì)應(yīng)關(guān)系是(前者是機(jī)器上 top,后者是 kubectl top):

rss + cache = (in)active_anon + (in)active_file

圖片

4.4 kubectl top pod 和 exec 進(jìn)入 pod 后看到的 top 不一樣

top 命令的差異和上邊一致,無(wú)法直接對(duì)比,同時(shí),就算你對(duì) pod 做了 limit 限制,pod 內(nèi)的 top 看到的內(nèi)存和 cpu 總量仍然是機(jī)器總量,并不是pod 可分配量

  • 進(jìn)程的RSS為進(jìn)程使用的所有物理內(nèi)存(file_rss+anon_rss),即Anonymous pages+Mapped apges(包含共享內(nèi)存)
  • cgroup RSS為(anonymous and swap cache memory),不包含共享內(nèi)存。兩者都不包含file cache

4.5 kubectl top pod 和 docker stats得到的值為什么不同?

docker stats dockerID 可以看到容器當(dāng)前的使用量:

圖片

如果你的 pod 中只有一個(gè) container,你會(huì)發(fā)現(xiàn) docker stats 值不等于kubectl top 的值,既不等于 container_memory_usage_bytes,也不等于container_memory_working_set_bytes。因?yàn)閐ocker stats 和 cadvisor 的計(jì)算方式不同,總體值會(huì)小于 kubectl top:計(jì)算邏輯是:

docker stats = container_memory_usage_bytes - container_memory_cache

五. 后記

一般情況下,我們并不需要時(shí)刻關(guān)心
node 或 pod 的使用量,因?yàn)橛屑鹤詣?dòng)擴(kuò)縮容(cluster-autoscaler)和 pod
水平擴(kuò)縮容(HPA)來(lái)應(yīng)對(duì)這兩種資源變化,資源指標(biāo)的意義更適合使用 prometheus 來(lái)持久化 cadvisor
的數(shù)據(jù),用于回溯歷史或者發(fā)送報(bào)警。其他補(bǔ)充:

  • 雖然 kubectl top help 中顯示支持 Storage,但直到 1.16 版本仍然不支持
  • 1.13 之前需要 heapster,1.13 以后需要 metric-server,這部分 kubectl top help 的輸出 有誤,里面只提到了heapster
  • k8s dashboard 中的監(jiān)控圖默認(rèn)使用的是 heapster,切換為 metric-server后數(shù)據(jù)會(huì)異常,需要多部署一個(gè)metric-server-scraper 的 pod 來(lái)做接口轉(zhuǎn)換,具體參考 pr:https://github.com/kubernetes/dashboard/pull/3504

六. 參考資料

  • https://github.com/kubernetes-sigs/metrics-server/issues/193
  • https://github.com/kubernetes/kubernetes/pull/83247
  • https://www.cnblogs.com/liuhongru/p/11215447.html
  • https://github.com/DirectXMan12/k8s-prometheus-adapter/blob/master/docs/walkthrough.md#quantity-values
  • https://github.com/fabric8io/kansible/blob/master/vendor/k8s.io/kubernetes/docs/design/resources.md
  • https://erdong.site/linux/system/computer-unit-conversion.html
  • https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/#meaning-of-cpu
  • https://access.redhat.com/documentation/zh-cn/red_hat_enterprise_linux/6/html/resource_management_guide/sec-memory
  • https://www.kernel.org/doc/Documentation/cgroup-v1/memory.txt
  • https://www.cnblogs.com/liuhongru/p/11215447.html
  • https://github.com/moby/moby/issues/10824
  • https://github.com/docker/cli/pull/80
責(zé)任編輯:龐桂玉 來(lái)源: 奇妙的Linux世界
相關(guān)推薦

2022-03-14 18:29:34

云合規(guī)監(jiān)控云平臺(tái)

2013-04-15 17:55:12

Windows認(rèn)證安全認(rèn)證

2013-04-16 10:33:58

Windows 安全認(rèn)微軟

2023-10-17 00:01:34

Linux操作系統(tǒng)

2022-03-24 13:55:37

云計(jì)算合規(guī)性監(jiān)控工具

2024-05-08 08:16:11

2020-08-06 00:14:16

Spring IoC依賴注入開(kāi)發(fā)

2023-08-11 09:41:48

AFLfuzzingPatch

2017-08-07 14:59:06

2017-01-21 10:31:01

云計(jì)算迪斯尼

2024-06-28 09:25:51

2014-09-19 10:46:36

LuaCC++

2010-03-29 14:26:57

無(wú)線網(wǎng)絡(luò)故障修復(fù)

2013-04-12 09:39:01

Top監(jiān)控系統(tǒng)

2024-05-13 11:12:08

FO-DICOM開(kāi)源應(yīng)用開(kāi)發(fā)

2020-04-06 14:50:43

MySQLSQL數(shù)據(jù)庫(kù)

2020-11-23 08:48:00

Kubernetes容器開(kāi)發(fā)

2021-03-15 10:23:44

IT支出技術(shù)投資CIO

2022-03-24 08:04:50

Kubernetes資源限制

2016-02-19 10:16:48

母嬰個(gè)推電商
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

主站蜘蛛池模板: 日美女逼逼 | 一区二区在线 | 亚洲成人免费在线 | 久久精品网 | 欧美精品在线观看 | 亚洲黄色av网站 | 欧美国产精品 | 色在线看| 国产欧美精品区一区二区三区 | 操操操日日日 | 国产中文 | 亚洲色图在线观看 | 日韩欧美国产精品一区二区 | 美女日皮网站 | 久久久久亚洲 | 欧美一区2区三区3区公司 | 天天人人精品 | 亚洲超碰在线观看 | 午夜三级在线观看 | 久久免费小视频 | 精品久久久久久亚洲精品 | 黄色在线免费播放 | 日韩久久久久 | 精品国产亚洲一区二区三区大结局 | 久久高清| 国产玖玖| 一区二区三区四区不卡视频 | 澳门永久av免费网站 | 成人性视频在线播放 | 国产成人精品一区二区三区在线 | 中文字幕一二三区 | 成人伊人| 精品国产一二三区 | 99精品国产一区二区三区 | 成人福利 | 久久久久久高潮国产精品视 | 精品欧美一区二区在线观看 | www.日日夜夜| 国产成人99久久亚洲综合精品 | 丝袜 亚洲 另类 欧美 综合 | 国产免费观看一级国产 |