Kubelet视图
Kubelet是运行在集群中每个节点上的代理程序,它提供了一些指标可以更好地了解集群的运行状态。
指标说明
Kubelet视图暴露的指标如下:
视图名称 |
单位 |
说明 |
---|---|---|
运行中Kubelet |
个 |
集群运行中的kubelet的数量 |
运行中Pod |
个 |
当前Kubelet所在节点上运行中Pod的数量 |
运行中容器 |
个 |
当前Kubelet所在节点上运行中容器的数量 |
实际卷数量 |
个 |
当前Kubelet所在节点的实际卷数量 |
期望卷数量 |
个 |
当前Kubelet所在节点的期望卷数量 |
配置错误数量 |
个 |
当前Kubelet所在节点的Kubelet配置错误数量 |
操作速率 |
次/秒 |
Kubelet每秒执行的操作的次数 |
操作错误率 |
次/秒 |
Kubelet每秒执行的操作失败的次数 |
操作时延 |
秒 |
Kubelet的不同操作的操作时延 |
Pod启动速率 |
次/秒 |
Kubelet每秒执行了pod start的次数 |
Pod启动时延(99分位) |
秒 |
Kubelet执行pod start操作中99%的操作的时延分布情况 |
存储操作速率 |
次/秒 |
Kubelet每秒执行的存储相关操作的次数 |
存储操作错误率 |
次/秒 |
Kubelet每秒执行的存储相关操作失败的次数 |
存储操作时延(99分位) |
秒 |
Kubelet执行存储操作中99%的操作的时延分布情况 |
控制组管理器操作速率 |
次/秒 |
每秒执行销毁或更新操作的次数 |
控制组管理器操作时延(99分位) |
秒 |
Kubelet执行销毁或更新操作中99%的操作的时延分布情况 |
PLEG relist速率 |
次/秒 |
Kubelet PLEG每秒执行relist的次数 |
PLEG relist间隔(99分位) |
秒 |
Kubelet PLEG relist中99%的操作的间隔分布情况 |
PLEG relist时延(99分位) |
秒 |
Kubelet PLEG relist中99%的操作的时延分布情况 |
RPC速率 |
次/秒 |
不同状态响应码的RPC请求的次数 |
请求时延(99分位) |
秒 |
不同method的请求的99%的时延分布情况 |
内存使用量 |
字节 |
Kubelet的内存使用量 |
CPU使用量 |
字节 |
Kubelet的CPU使用量 |
Go routine数 |
个 |
Go协程数量 |
指标清单
Kubelet视图使用的指标清单如下:
指标 |
类型 |
说明 |
---|---|---|
storage_operation_errors_total |
Counter |
存储操作期间发生的错误次数 |
storage_operation_duration_seconds_count |
Counter |
存储操作的操作次数 |
storage_operation_duration_seconds_bucket |
Histogram |
存储操作的持续时间 |
kubelet_pod_start_duration_seconds_count |
Counter |
进行过pod start的数量 |
kubelet_pod_start_duration_seconds_bucket |
Histogram |
pod start的耗时分布情况 |
kubelet_runtime_operations_duration_seconds_bucket |
Histogram |
不同操作的累计操作耗时分布情况 |
kubelet_runtime_operations_errors_total |
Counter |
不同操作的累计操作失败的数量 |
kubelet_node_config_error |
Gauge |
如果节点遇到与配置相关的错误,则此指标为true(1),否则为false(0) |
volume_manager_total_volumes |
Gauge |
Volume Manager中的卷数 |
kubelet_running_containers |
Gauge |
当前运行的Containers数 |
kubelet_running_pods |
Gauge |
当前运行的pod数 |
kubelet_node_name |
Gauge |
节点名称,值始终为1 |
kubelet_runtime_operations_total |
Counter |
运行过程中不同的操作类型的累计操作次数 |
kubelet_cgroup_manager_duration_seconds_count |
Counter |
销毁和更新的数量 |
kubelet_cgroup_manager_duration_seconds_bucket |
Histogram |
销毁和更新操作的耗时分布情况 |
kubelet_pleg_relist_duration_seconds_count |
Counter |
PLEG relist pod不同耗时的数量 |
kubelet_pleg_relist_interval_seconds_bucket |
Histogram |
PLEG relist 间隔的分布情况 |
kubelet_pleg_relist_duration_seconds_bucket |
Histogram |
PLEG relist pod耗时的分布情况 |
rest_client_requests_total |
Counter |
请求apiserver的总次数(按照返回码code和请求类型method统计) |
rest_client_request_duration_seconds_bucket |
Histogram |
请求apiserver的总次数(按照返回码code和请求类型method统计)的分布情况 |
process_resident_memory_bytes |
Gauge |
进程驻留内存大小(以字节为单位) |
process_cpu_seconds_total |
Counter |
进程用户和系统 CPU 总时间(以秒为单位) |
go_goroutines |
Gauge |
协程数量 |