集群视图
基于集群的指标和PromQL语句,提供了集群节点、CPU、内存、网络、磁盘等关键资源相关图表,帮助您了解整体集群的资源运行状态。接下来主要从指标说明、指标清单两个部分来进行图表的说明,其中图表中对于数值过大的字节(bytes)会换算为MB、KB、GB等。
指标说明
集群视图暴露的指标包括基础资源指标、网络指标和磁盘指标,具体说明如下:
指标名称 |
单位 |
说明 |
---|---|---|
节点数 |
个 |
集群中的节点个数。 |
磁盘不可用节点数 |
个 |
集群中磁盘不可用的节点个数。 |
不可用节点数 |
个 |
集群中未就绪的节点个数。 |
CPU使用率 |
百分比 |
集群中所有容器的CPU使用量总和占所有容器设置的Limit总和的百分比。 |
CPU Requests水位 |
百分比 |
集群整体CPU Requests占集群CPU容量的百分比。 |
CPU Limits水位 |
百分比 |
集群整体CPU Limits占集群CPU容量的百分比。 |
内存使用率 |
百分比 |
集群中所有容器的内存使用量总和占所有容器设置的Limit总和的百分比。 |
内存Request水位 |
百分比 |
集群整体内存Requests占集群内存容量的百分比。 |
内存Limit水位 |
百分比 |
集群整体内存Limits占集群内存容量的百分比。 |
Pod数 |
个 |
集群中处在不同运行状态下的Pod个数(状态包含:Failed、Pending、Running、Succeeded、Unknown等)。 |
容器数 |
个 |
集群中处在不同运行状态下的容器个数(状态包含:Containers Running、Containers Waiting、Containers Terminated等)。 |
CPU使用量 |
Cores |
以命名空间为粒度统计各个命名空间内的所有容器的CPU使用量之和。 |
内存使用量 |
字节 |
以命名空间为粒度统计各个命名空间内的所有容器的内存使用量之和。 |
指标名称 |
单位 |
说明 |
---|---|---|
网络接收速率 |
字节/秒 |
以命名空间为粒度统计各个命名空间内的所有容器每秒接收的字节数之和。 |
网络发送速率 |
字节/秒 |
以命名空间为粒度统计各个命名空间内的所有容器每秒传输的字节数之和。 |
网络平均接收速率 |
字节/秒 |
以命名空间为粒度统计各个命名空间内的容器每秒平均接收的字节数。 |
网络平均发送速率 |
字节/秒 |
以命名空间为粒度统计各个命名空间内的容器每秒平均传输的字节数。 |
接收数据包速率 |
个/秒 |
以命名空间为粒度统计各个命名空间内的所有容器每秒接收的数据包数之和。 |
集群发送数据包速率 |
个/秒 |
以命名空间为粒度统计各个命名空间内所有容器每秒发送的数据包数之和。 |
丢包速率(接收) |
个/秒 |
以命名空间为粒度统计各个命名空间内所有容器每秒接收的数据丢包数之和。 |
丢包速率(发送) |
个/秒 |
以命名空间为粒度统计各个命名空间内所有容器每秒发送的数据丢包数之和。 |
指标说明 |
单位 |
说明 |
---|---|---|
磁盘读写IO速率(读+写) |
次数/秒 |
以命名空间为粒度统计各个命名空间内所有容器每秒的磁盘读写IO的次数之和。 |
磁盘读写吞吐量(读+写) |
字节/秒 |
以命名空间为粒度统计各个命名空间内所有容器每秒的磁盘读写字节量之和。 |
指标清单
集群视图使用的指标清单如下:
指标 |
指标类型 |
说明 |
---|---|---|
kube_pod_container_resource_requests |
gauge |
容器请求的请求资源数 |
kube_pod_container_resource_limits |
gauge |
容器请求的限制资源数 |
kube_node_status_allocatable |
gauge |
节点可分配的资源总数 |
kube_pod_status_phase |
gauge |
Pod当前阶段 |
node_memory_MemAvailable_bytes |
gauge |
节点内存可用字节数 |
node_memory_MemTotal_bytes |
gauge |
节点内存总字节数 |
node_cpu_seconds_total |
counter |
在不同模式下节点累计CPU花费的时间 |
kube_node_info |
gauge |
节点信息 |
kube_node_status_condition |
gauge |
节点状态信息 |
kube_pod_container_status_waiting |
gauge |
容器是否处在waiting状态 |
kube_pod_container_status_terminated |
gauge |
容器是否处在终止状态 |
container_cpu_usage_seconds_total |
counter |
容器CPU累计使用时间 |
container_memory_rss |
gauge |
RSS内存,即常驻内存集。是分配给进程使用的实际物理内存字节数,不是磁盘上缓存的虚机内存。 |
container_network_receive_bytes_total |
counter |
容器网络累积接收字节数 |
container_network_transmit_bytes_total |
counter |
容器网络累积传输字节数 |
container_network_receive_packets_total |
counter |
容器网络收到的累计数据包数 |
container_network_transmit_packets_total |
counter |
容器网络传输的累计数据包数 |
container_network_receive_packets_dropped_total |
counter |
容器网络接收时丢失的数据包数 |
container_network_transmit_packets_dropped_total |
counter |
容器网络传输时丢失的数据包数 |
container_fs_reads_total |
counter |
容器磁盘读取次数 |
container_fs_reads_bytes_total |
counter |
容器磁盘读取的总字节数 |