成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

<sup id="gqgyc"></sup>

<samp id="gqgyc"></samp>

<li id="gqgyc"><acronym id="gqgyc"></acronym></li>

<strike id="gqgyc"><center id="gqgyc"></center></strike>

鴻蒙開發者社區

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發者社區

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發者社區訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業版APP

鴻蒙開發者社區視頻號

51CTO軟考題庫

賬號設置退出

Kubernetes節點之間的ping監控

作者：dummy 2019-10-17 21:14:08

在診斷Kubernetes集群問題的時候，我們經常注意到集群中某一節點在閃爍*，而這通常是隨機的且以奇怪的方式發生。這就是為什么我們一直需要一種工具，它可以測試一個節點與另一個節點之間的可達性，并以Prometheus度量形式呈現結果。

在診斷Kubernetes集群問題的時候，我們經常注意到集群中某一節點在閃爍*，而這通常是隨機的且以奇怪的方式發生。這就是為什么我們一直需要一種工具，它可以測試一個節點與另一個節點之間的可達性，并以Prometheus度量形式呈現結果。有了這個工具，我們還希望在Grafana中創建圖表并快速定位發生故障的節點(并在必要時將該節點上所有Pod進行重新調度并進行必要的維護)。

“閃爍”這里我是指某個節點隨機變為“NotReady”但之后又恢復正常的某種行為。例如部分流量可能無法到達相鄰節點上的Pod。

為什么會發生這種情況?常見原因之一是數據中心交換機中的連接問題。例如，我們曾經在Hetzner中設置一個vswitch，其中一個節點已無法通過該vswitch端口使用，并且恰好在本地網絡上完全不可訪問。

我們的最后一個要求是可直接在Kubernetes中運行此服務，因此我們將能夠通過Helm圖表部署所有內容。(例如在使用Ansible的情況下，我們必須為各種環境中的每個角色定義角色：AWS、GCE、裸機等)。由于我們尚未找到針對此環境的現成解決方案，因此我們決定自己來實現。

腳本和配置

我們解決方案的主要組件是一個腳本，該腳本監視每個節點的.status.addresses值。如果某個節點的該值已更改(例如添加了新節點)，則我們的腳本使用Helm value方式將節點列表以ConfigMap的形式傳遞給Helm圖表：

apiVersion: v1 
kind: ConfigMap 
metadata: 
name: ping-exporter-config 
namespace: d8-system 
data: 
nodes.json: > 
{{ .Values.pingExporter.targets | toJson }}  
 
 
.Values.pingExporter.targets類似以下： 
 
"cluster_targets":[{"ipAddress":"192.168.191.11","name":"kube-a-3"},{"ipAddress":"192.168.191.12","name":"kube-a-2"},{"ipAddress":"192.168.191.22","name":"kube-a-1"},{"ipAddress":"192.168.191.23","name":"kube-db-1"},{"ipAddress":"192.168.191.9","name":"kube-db-2"},{"ipAddress":"51.75.130.47","name":"kube-a-4"}],"external_targets":[{"host":"8.8.8.8","name":"google-dns"},{"host":"youtube.com"}]}

下面是Python腳本：

#!/usr/bin/env python3 
 
import subprocess 
import prometheus_client 
import re 
import statistics 
import os 
import json 
import glob 
import better_exchook 
import datetime 
 
better_exchook.install() 
 
FPING_CMDLINE = "/usr/sbin/fping -p 1000 -C 30 -B 1 -q -r 1".split(" ") 
FPING_REGEX = re.compile(r"^(\S*)\s*: (.*)$", re.MULTILINE) 
CONFIG_PATH = "/config/targets.json" 
 
registry = prometheus_client.CollectorRegistry() 
 
prometheus_exceptions_counter = \ 
prometheus_client.Counter('kube_node_ping_exceptions', 'Total number of exceptions', [], registry=registry) 
 
prom_metrics_cluster = {"sent": prometheus_client.Counter('kube_node_ping_packets_sent_total', 
                                              'ICMP packets sent', 
                                              ['destination_node', 'destination_node_ip_address'], 
                                              registry=registry), 
            "received": prometheus_client.Counter('kube_node_ping_packets_received_total', 
                                                  'ICMP packets received', 
                                                 ['destination_node', 'destination_node_ip_address'], 
                                                 registry=registry), 
            "rtt": prometheus_client.Counter('kube_node_ping_rtt_milliseconds_total', 
                                             'round-trip time', 
                                            ['destination_node', 'destination_node_ip_address'], 
                                            registry=registry), 
            "min": prometheus_client.Gauge('kube_node_ping_rtt_min', 'minimum round-trip time', 
                                           ['destination_node', 'destination_node_ip_address'], 
                                           registry=registry), 
            "max": prometheus_client.Gauge('kube_node_ping_rtt_max', 'maximum round-trip time', 
                                           ['destination_node', 'destination_node_ip_address'], 
                                           registry=registry), 
            "mdev": prometheus_client.Gauge('kube_node_ping_rtt_mdev', 
                                            'mean deviation of round-trip times', 
                                            ['destination_node', 'destination_node_ip_address'], 
                                            registry=registry)} 
 
 
prom_metrics_external = {"sent": prometheus_client.Counter('external_ping_packets_sent_total', 
                                              'ICMP packets sent', 
                                              ['destination_name', 'destination_host'], 
                                              registry=registry), 
            "received": prometheus_client.Counter('external_ping_packets_received_total', 
                                                  'ICMP packets received', 
                                                 ['destination_name', 'destination_host'], 
                                                 registry=registry), 
            "rtt": prometheus_client.Counter('external_ping_rtt_milliseconds_total', 
                                             'round-trip time', 
                                            ['destination_name', 'destination_host'], 
                                            registry=registry), 
            "min": prometheus_client.Gauge('external_ping_rtt_min', 'minimum round-trip time', 
                                           ['destination_name', 'destination_host'], 
                                           registry=registry), 
            "max": prometheus_client.Gauge('external_ping_rtt_max', 'maximum round-trip time', 
                                           ['destination_name', 'destination_host'], 
                                           registry=registry), 
            "mdev": prometheus_client.Gauge('external_ping_rtt_mdev', 
                                            'mean deviation of round-trip times', 
                                            ['destination_name', 'destination_host'], 
                                            registry=registry)} 
 
def validate_envs(): 
envs = {"MY_NODE_NAME": os.getenv("MY_NODE_NAME"), "PROMETHEUS_TEXTFILE_DIR": os.getenv("PROMETHEUS_TEXTFILE_DIR"), 
        "PROMETHEUS_TEXTFILE_PREFIX": os.getenv("PROMETHEUS_TEXTFILE_PREFIX")} 
 
for k, v in envs.items(): 
    if not v: 
        raise ValueError("{} environment variable is empty".format(k)) 
 
return envs 
 
 
@prometheus_exceptions_counter.count_exceptions() 
def compute_results(results): 
computed = {} 
 
matches = FPING_REGEX.finditer(results) 
for match in matches: 
    host = match.group(1) 
    ping_results = match.group(2) 
    if "duplicate" in ping_results: 
        continue 
    splitted = ping_results.split(" ") 
    if len(splitted) != 30: 
        raise ValueError("ping returned wrong number of results: \"{}\"".format(splitted)) 
 
    positive_results = [float(x) for x in splitted if x != "-"] 
    if len(positive_results) > 0: 
        computed[host] = {"sent": 30, "received": len(positive_results), 
                        "rtt": sum(positive_results), 
                        "max": max(positive_results), "min": min(positive_results), 
                        "mdev": statistics.pstdev(positive_results)} 
    else: 
        computed[host] = {"sent": 30, "received": len(positive_results), "rtt": 0, 
                        "max": 0, "min": 0, "mdev": 0} 
if not len(computed): 
    raise ValueError("regex match\"{}\" found nothing in fping output \"{}\"".format(FPING_REGEX, results)) 
return computed 
 
 
@prometheus_exceptions_counter.count_exceptions() 
def call_fping(ips): 
cmdline = FPING_CMDLINE + ips 
process = subprocess.run(cmdline, stdout=subprocess.PIPE, 
                         stderr=subprocess.STDOUT, universal_newlines=True) 
if process.returncode == 3: 
    raise ValueError("invalid arguments: {}".format(cmdline)) 
if process.returncode == 4: 
    raise OSError("fping reported syscall error: {}".format(process.stderr)) 
 
return process.stdout 
 
 
envs = validate_envs() 
 
files = glob.glob(envs["PROMETHEUS_TEXTFILE_DIR"] + "*") 
for f in files: 
os.remove(f) 
 
labeled_prom_metrics = {"cluster_targets": [], "external_targets": []} 
 
while True: 
with open(CONFIG_PATH, "r") as f: 
    config = json.loads(f.read()) 
    config["external_targets"] = [] if config["external_targets"] is None else config["external_targets"] 
    for target in config["external_targets"]: 
        target["name"] = target["host"] if "name" not in target.keys() else target["name"] 
 
if labeled_prom_metrics["cluster_targets"]: 
    for metric in labeled_prom_metrics["cluster_targets"]: 
        if (metric["node_name"], metric["ip"]) not in [(node["name"], node["ipAddress"]) for node in config['cluster_targets']]: 
            for k, v in prom_metrics_cluster.items(): 
                v.remove(metric["node_name"], metric["ip"]) 
 
if labeled_prom_metrics["external_targets"]: 
    for metric in labeled_prom_metrics["external_targets"]: 
        if (metric["target_name"], metric["host"]) not in [(target["name"], target["host"]) for target in config['external_targets']]: 
            for k, v in prom_metrics_external.items(): 
                v.remove(metric["target_name"], metric["host"]) 
 
 
labeled_prom_metrics = {"cluster_targets": [], "external_targets": []} 
 
for node in config["cluster_targets"]: 
    metrics = {"node_name": node["name"], "ip": node["ipAddress"], "prom_metrics": {}} 
 
    for k, v in prom_metrics_cluster.items(): 
        metrics["prom_metrics"][k] = v.labels(node["name"], node["ipAddress"]) 
 
    labeled_prom_metrics["cluster_targets"].append(metrics) 
 
for target in config["external_targets"]: 
    metrics = {"target_name": target["name"], "host": target["host"], "prom_metrics": {}} 
 
    for k, v in prom_metrics_external.items(): 
        metrics["prom_metrics"][k] = v.labels(target["name"], target["host"]) 
 
    labeled_prom_metrics["external_targets"].append(metrics) 
 
out = call_fping([prom_metric["ip"]   for prom_metric in labeled_prom_metrics["cluster_targets"]] + \ 
                 [prom_metric["host"] for prom_metric in labeled_prom_metrics["external_targets"]]) 
computed = compute_results(out) 
 
for dimension in labeled_prom_metrics["cluster_targets"]: 
    result = computed[dimension["ip"]] 
    dimension["prom_metrics"]["sent"].inc(computed[dimension["ip"]]["sent"]) 
    dimension["prom_metrics"]["received"].inc(computed[dimension["ip"]]["received"]) 
    dimension["prom_metrics"]["rtt"].inc(computed[dimension["ip"]]["rtt"]) 
    dimension["prom_metrics"]["min"].set(computed[dimension["ip"]]["min"]) 
    dimension["prom_metrics"]["max"].set(computed[dimension["ip"]]["max"]) 
    dimension["prom_metrics"]["mdev"].set(computed[dimension["ip"]]["mdev"]) 
 
for dimension in labeled_prom_metrics["external_targets"]: 
    result = computed[dimension["host"]] 
    dimension["prom_metrics"]["sent"].inc(computed[dimension["host"]]["sent"]) 
    dimension["prom_metrics"]["received"].inc(computed[dimension["host"]]["received"]) 
    dimension["prom_metrics"]["rtt"].inc(computed[dimension["host"]]["rtt"]) 
    dimension["prom_metrics"]["min"].set(computed[dimension["host"]]["min"]) 
    dimension["prom_metrics"]["max"].set(computed[dimension["host"]]["max"]) 
    dimension["prom_metrics"]["mdev"].set(computed[dimension["host"]]["mdev"]) 
 
prometheus_client.write_to_textfile( 
    
envs["PROMETHEUS_TEXTFILE_DIR"] + envs["PROMETHEUS_TEXTFILE_PREFIX"] + envs["MY_NODE_NAME"] + ".prom", registry)

該腳本在每個Kubernetes節點上運行，并且每秒兩次發送ICMP數據包到Kubernetes集群的所有實例。收集的結果會存儲在文本文件中。

該腳本會包含在Docker鏡像中：

FROM python:3.6-alpine3.8 
COPY rootfs / 
WORKDIR /app 
RUN pip3 install --upgrade pip && pip3 install -r requirements.txt && apk add --no-cache fping 
ENTRYPOINT ["python3", "/app/ping-exporter.py"]

另外，我們還創建了一個ServiceAccount和一個具有唯一權限的對應角色用于獲取節點列表(這樣我們就可以知道它們的IP地址)：

apiVersion: v1 
kind: ServiceAccount 
metadata: 
name: ping-exporter 
namespace: d8-system 
--- 
kind: ClusterRole 
apiVersion: rbac.authorization.k8s.io/v1 
metadata: 
name: d8-system:ping-exporter 
rules: 
- apiGroups: [""] 
resources: ["nodes"] 
verbs: ["list"] 
--- 
kind: ClusterRoleBinding 
apiVersion: rbac.authorization.k8s.io/v1 
metadata: 
name: d8-system:kube-ping-exporter 
subjects: 
- kind: ServiceAccount 
name: ping-exporter 
namespace: d8-system 
roleRef: 
apiGroup: rbac.authorization.k8s.io 
kind: ClusterRole 
name: d8-system:ping-exporter

最后，我們需要DaemonSet來運行在集群中的所有實例：

apiVersion: apps/v1 
kind: DaemonSet 
metadata: 
name: ping-exporter 
namespace: d8-system 
spec: 
updateStrategy: 
type: RollingUpdate 
selector: 
matchLabels: 
  name: ping-exporter 
template: 
metadata: 
  labels: 
    name: ping-exporter 
spec: 
  terminationGracePeriodSeconds: 0 
  tolerations: 
  - operator: "Exists" 
  hostNetwork: true 
  serviceAccountName: ping-exporter 
  priorityClassName: cluster-low 
  containers: 
  - image: private-registry.flant.com/ping-exporter/ping-exporter:v1 
    name: ping-exporter 
    env: 
      - name: MY_NODE_NAME 
        valueFrom: 
          fieldRef: 
            fieldPath: spec.nodeName 
      - name: PROMETHEUS_TEXTFILE_DIR 
        value: /node-exporter-textfile/ 
      - name: PROMETHEUS_TEXTFILE_PREFIX 
        value: ping-exporter_ 
    volumeMounts: 
      - name: textfile 
        mountPath: /node-exporter-textfile 
      - name: config 
        mountPath: /config 
  volumes: 
    - name: textfile 
      hostPath: 
        path: /var/run/node-exporter-textfile 
    - name: config 
      configMap: 
        name: ping-exporter-config 
  imagePullSecrets: 
  - name: private-registry

該解決方案的最后操作細節是：

Python腳本執行時，其結果(即存儲在主機上/var/run/node-exporter-textfile目錄中的文本文件)將傳遞到DaemonSet類型的node-exporter。
node-exporter使用--collector.textfile.directory /host/textfile參數啟動，這里的/host/textfile是hostPath目錄/var/run/node-exporter-textfile。(你可以點擊這里了解關于node-exporter中文本文件收集器的更多信息。)
最后node-exporter讀取這些文件，然后Prometheus從node-exporter實例上收集所有數據。

那么結果如何?

現在該來享受期待已久的結果了。指標創建之后，我們可以使用它們，當然也可以對其進行可視化。以下可以看到它們是怎樣的。

首先，有一個通用選擇器可讓我們在其中選擇節點以檢查其“源”和“目標”連接。你可以獲得一個匯總表，用于在Grafana儀表板中指定的時間段內ping選定節點的結果：

以下是包含有關選定節點的組合統計信息的圖形：

另外，我們有一個記錄列表，其中每個記錄都鏈接到在“源”節點中選擇的每個特定節點的圖：

如果將記錄展開，你將看到從當前節點到目標節點中已選擇的所有其他節點的詳細ping統計信息：

下面是相關的圖形：

節點之間的ping出現問題的圖看起來如何?

如果你在現實生活中觀察到類似情況，那就該進行故障排查了!

最后，這是我們對外部主機執行ping操作的可視化效果：

我們可以檢查所有節點的總體視圖，也可以僅檢查任何特定節點的圖形：

當你觀察到僅影響某些特定節點的連接問題時，這可能會有所幫助。

責任編輯：未麗燕來源： Dockone.in

Kubernetes 節點 Python

51CTO技術棧公眾號

業務
速覽

媒體

51CTO CIOAge HC3i

社區

51CTO博客鴻蒙開發者社區 AI.x社區

教育

51CTO學堂精培企業培訓 CTO訓練營

主站蜘蛛池模板：黄色国产视频 | 九九视频在线观看 | 精品久久久久久久久亚洲 | 高清国产一区二区 | 成人精品国产一区二区4080 | 久久综合伊人一区二区三 | 日韩在线视频播放 | 国产精品久久久久久久久久 | 91精品国产91久久久久久三级 | 久久久久久久久久久国产 | 欧美视频1 | 国产亚洲精品久久19p | 久久精品一区二区 | 日韩精品视频在线播放 | 亚洲午夜精品在线观看 | 91精品久久久久久综合五月天 | 亚洲日本一区二区 | 一个色在线| 欧美一级视频免费看 | 精品国产乱码久久久久久果冻传媒 | 国产在线精品一区二区三区 | 国产精品视频在线播放 | 久草成人网 | 亚洲日本乱码在线观看 | 午夜网| 久草热在线 | 久久噜噜噜精品国产亚洲综合 | 欧美又大粗又爽又黄大片视频 | 久久久久91 | 国产精品美女久久久 | 国产精品中文字幕在线 | 一区二区三区四区国产 | 九九热这里只有精品6 | 午夜精品久久久久久不卡欧美一级 | v片网站 | 亚洲人精品午夜 | 亚洲一区二区三区四区av | 久久久久久成人 | 国产成人精品久久二区二区91 | 国产精品黄视频 | 国产日韩精品在线 |

<li id="se8s4"><table id="se8s4"></table></li>

<sup id="se8s4"></sup>

<ul id="se8s4"><option id="se8s4"></option></ul>

<strike id="se8s4"></strike>