Kubernetes中配置livenessProbe、ReadinessProbe和StartupProbe
livenessProbe、readinessProbe和startupProbe作用
kubelet使用livenessProbe(存活探針)來判斷何時重啟容器。例如,當程序中產生死鎖的時候,程序還在運行,通過livenessProbe可以檢測到程序已不能正常提供服務。這種情況下重啟容器可以讓程序恢復可用的狀態(雖然程序中存在會導致死鎖的bug)。如果沒有配置livenessProbe,則默認狀態為Success。
kubelet使用readinessProbe(就緒探針)來判斷容器何時準備好了接受流量。當Pod中的所有容器都準備好時,Pod就被認為準備好了。最重要的用途是用來控制哪些pod被用作服務的后端。當一個Pod未準備好時,在負載均衡中會被移除。如果沒有配置readinessProbe,則默認狀態為Success。
Kubernetes從1.17版本開始新增了startupProbe(啟動探針),kubelet使用startupProbe來判斷容器應用程序何時啟動。如果配置了startupProbe,等啟動成功后才會進行livenessProbe和readinessProbe。這樣可以避免應用程序在啟動過程被livenessProbe和readinessProbe影響。如果沒有配置startupProbe,則默認狀態為Success。
k8s中的四種健康檢查方式
livenessProbe、readinessProbe和startupProbe都可以稱為健康檢查,這幾種健康檢查類型都支持四種檢查方式:exec命令、httpGet、tcpSocket和grpc。其中exec命令行方式通用性最強,適用于大部分場景,tcpSocket方式適用于TCP類型的服務,httpGet方式適用于http類型的服務,grpc方式適用于grpc類型的服務。
- exec:可以將自定義的健康檢查方法封裝成命令行(CLI)工具使用exec來執行,如果檢測結果是正常,命令行返回0值,否則返回非0值。
- httpGet:通過容器的IP地址、端口及服務提供的http接口路徑,發起一個HTTP Get請求,如果響應的狀態碼大于等于200且小于400,則認為服務是健康的。
- tcpSocket:通過容器的IP地址和端口,發起一個tcp請求,能建立連接則認為服務是健康的。
- grpc:通過容器的IP地址和端口,發起一個grpc請求(前提是服務實現了grpc健康檢查協議),返回服務健康的結果正常則認為服務是健康的。
配置探針的常用可選參數如下:
參數名稱 | 默認值 | 最小值 | 描述 |
initialDelaySeconds | 0秒 | 0秒 | 容器啟動后多久開始進行第一次探測。 |
periodSeconds | 10秒 | 1秒 | 探測頻度,頻率過高會對pod帶來較大的額外開銷,頻率過低則無法及時反映容器真實情況。 |
timeoutSeconds | 1秒 | 1秒 | 探測超時時間。 |
failureThreshold | 3 | 1 | 處于成功狀態時,探測連續失敗幾次可被認為失敗。 |
successThreshold | 1 | 1 | 處于失敗狀態時,探測連續成功幾次,被認為成功。 |
配置示例
livenessProbe、readinessProbe和startupProbe的配置方法基本類似,下面就以配置livenessProbe為例。
exec方式
httpGet方式
tcpSocket方式
grpc方式
更多關于健康檢查配置的說明可以參考kubernetes官方文檔:
https://kubernetes.io/docs/tasks/configure-pod-container/configure-liveness-readiness-startup-probes/。