更新时间:2024-08-17 GMT+08:00

Kubelet视图

Kubelet是运行在集群中每个节点上的代理程序,它提供了一些指标可以更好地了解集群的运行状态。

指标说明

Kubelet视图暴露的指标如下:

表1 Kubelet图表说明

视图名称

单位

说明

运行中Kubelet

集群运行中的kubelet的数量

运行中Pod

当前Kubelet所在节点上运行中Pod的数量

运行中容器

当前Kubelet所在节点上运行中容器的数量

实际卷数量

当前Kubelet所在节点的实际卷数量

期望卷数量

当前Kubelet所在节点的期望卷数量

配置错误数量

当前Kubelet所在节点的Kubelet配置错误数量

操作速率

次/秒

Kubelet每秒执行的操作的次数

操作错误率

次/秒

Kubelet每秒执行的操作失败的次数

操作时延

Kubelet的不同操作的操作时延

Pod启动速率

次/秒

Kubelet每秒执行了pod start的次数

Pod启动时延(99分位)

Kubelet执行pod start操作中99%的操作的时延分布情况

存储操作速率

次/秒

Kubelet每秒执行的存储相关操作的次数

存储操作错误率

次/秒

Kubelet每秒执行的存储相关操作失败的次数

存储操作时延(99分位)

Kubelet执行存储操作中99%的操作的时延分布情况

控制组管理器操作速率

次/秒

每秒执行销毁或更新操作的次数

控制组管理器操作时延(99分位)

Kubelet执行销毁或更新操作中99%的操作的时延分布情况

PLEG relist速率

次/秒

Kubelet PLEG每秒执行relist的次数

PLEG relist间隔(99分位)

Kubelet PLEG relist中99%的操作的间隔分布情况

PLEG relist时延(99分位)

Kubelet PLEG relist中99%的操作的时延分布情况

RPC速率

次/秒

不同状态响应码的RPC请求的次数

请求时延(99分位)

不同method的请求的99%的时延分布情况

内存使用量

字节

Kubelet的内存使用量

CPU使用量

字节

Kubelet的CPU使用量

Go routine数

Go协程数量

指标清单

Kubelet视图使用的指标清单如下:

表2 Kubelet指标说明

指标

类型

说明

storage_operation_errors_total

Counter

存储操作期间发生的错误次数

storage_operation_duration_seconds_count

Counter

存储操作的操作次数

storage_operation_duration_seconds_bucket

Histogram

存储操作的持续时间

kubelet_pod_start_duration_seconds_count

Counter

进行过pod start的数量

kubelet_pod_start_duration_seconds_bucket

Histogram

pod start的耗时分布情况

kubelet_runtime_operations_duration_seconds_bucket

Histogram

不同操作的累计操作耗时分布情况

kubelet_runtime_operations_errors_total

Counter

不同操作的累计操作失败的数量

kubelet_node_config_error

Gauge

如果节点遇到与配置相关的错误,则此指标为true(1),否则为false(0)

volume_manager_total_volumes

Gauge

Volume Manager中的卷数

kubelet_running_containers

Gauge

当前运行的Containers数

kubelet_running_pods

Gauge

当前运行的pod数

kubelet_node_name

Gauge

节点名称,值始终为1

kubelet_runtime_operations_total

Counter

运行过程中不同的操作类型的累计操作次数

kubelet_cgroup_manager_duration_seconds_count

Counter

销毁和更新的数量

kubelet_cgroup_manager_duration_seconds_bucket

Histogram

销毁和更新操作的耗时分布情况

kubelet_pleg_relist_duration_seconds_count

Counter

PLEG relist pod不同耗时的数量

kubelet_pleg_relist_interval_seconds_bucket

Histogram

PLEG relist 间隔的分布情况

kubelet_pleg_relist_duration_seconds_bucket

Histogram

PLEG relist pod耗时的分布情况

rest_client_requests_total

Counter

请求apiserver的总次数(按照返回码code和请求类型method统计)

rest_client_request_duration_seconds_bucket

Histogram

请求apiserver的总次数(按照返回码code和请求类型method统计)的分布情况

process_resident_memory_bytes

Gauge

进程驻留内存大小(以字节为单位)

process_cpu_seconds_total

Counter

进程用户和系统 CPU 总时间(以秒为单位)

go_goroutines

Gauge

协程数量