更新时间:2024-06-17 GMT+08:00
分享

集群视图

基于集群的指标和PromQL语句,提供了集群节点、CPU、内存、网络、磁盘等关键资源相关图表,帮助您了解整体集群的资源运行状态。接下来主要从指标说明、指标清单两个部分来进行图表的说明,其中图表中对于数值过大的字节(bytes)会换算为MB、KB、GB等。

指标说明

集群视图暴露的指标包括基础资源指标、网络指标和磁盘指标,具体说明如下:

图1 基础资源图表
表1 基础资源图表说明

指标名称

单位

说明

节点数

集群中的节点个数。

磁盘不可用节点数

集群中磁盘不可用的节点个数。

不可用节点数

集群中未就绪的节点个数。

CPU使用率

百分比

集群中所有容器的CPU使用量总和占所有容器设置的Limit总和的百分比。

CPU Requests水位

百分比

集群整体CPU Requests占集群CPU容量的百分比。

CPU Limits水位

百分比

集群整体CPU Limits占集群CPU容量的百分比。

内存使用率

百分比

集群中所有容器的内存使用量总和占所有容器设置的Limit总和的百分比。

内存Request水位

百分比

集群整体内存Requests占集群内存容量的百分比。

内存Limit水位

百分比

集群整体内存Limits占集群内存容量的百分比。

Pod数

集群中处在不同运行状态下的Pod个数(状态包含:Failed、Pending、Running、Succeeded、Unknown等)。

容器数

集群中处在不同运行状态下的容器个数(状态包含:Containers Running、Containers Waiting、Containers Terminated等)。

CPU使用量

Cores

以命名空间为粒度统计各个命名空间内的所有容器的CPU使用量之和。

内存使用量

字节

以命名空间为粒度统计各个命名空间内的所有容器的内存使用量之和。

图2 网络图表
表2 网络图表说明

指标名称

单位

说明

网络接收速率

字节/秒

以命名空间为粒度统计各个命名空间内的所有容器每秒接收的字节数之和。

网络发送速率

字节/秒

以命名空间为粒度统计各个命名空间内的所有容器每秒传输的字节数之和。

网络平均接收速率

字节/秒

以命名空间为粒度统计各个命名空间内的容器每秒平均接收的字节数。

网络平均发送速率

字节/秒

以命名空间为粒度统计各个命名空间内的容器每秒平均传输的字节数。

接收数据包速率

个/秒

以命名空间为粒度统计各个命名空间内的所有容器每秒接收的数据包数之和。

集群发送数据包速率

个/秒

以命名空间为粒度统计各个命名空间内所有容器每秒发送的数据包数之和。

丢包速率(接收)

个/秒

以命名空间为粒度统计各个命名空间内所有容器每秒接收的数据丢包数之和。

丢包速率(发送)

个/秒

以命名空间为粒度统计各个命名空间内所有容器每秒发送的数据丢包数之和。

图3 磁盘图表
表3 磁盘图表说明

指标说明

单位

说明

磁盘读写IO速率(读+写)

次数/秒

以命名空间为粒度统计各个命名空间内所有容器每秒的磁盘读写IO的次数之和。

磁盘读写吞吐量(读+写)

字节/秒

以命名空间为粒度统计各个命名空间内所有容器每秒的磁盘读写字节量之和。

指标清单

集群视图使用的指标清单如下:

表4 集群视图指标清单

指标

指标类型

说明

kube_pod_container_resource_requests

gauge

容器请求的请求资源数

kube_pod_container_resource_limits

gauge

容器请求的限制资源数

kube_node_status_allocatable

gauge

节点可分配的资源总数

kube_pod_status_phase

gauge

Pod当前阶段

node_memory_MemAvailable_bytes

gauge

节点内存可用字节数

node_memory_MemTotal_bytes

gauge

节点内存总字节数

node_cpu_seconds_total

counter

在不同模式下节点累计CPU花费的时间

kube_node_info

gauge

节点信息

kube_node_status_condition

gauge

节点状态信息

kube_pod_container_status_waiting

gauge

容器是否处在waiting状态

kube_pod_container_status_terminated

gauge

容器是否处在终止状态

container_cpu_usage_seconds_total

counter

容器CPU累计使用时间

container_memory_rss

gauge

RSS内存,即常驻内存集。是分配给进程使用的实际物理内存字节数,不是磁盘上缓存的虚机内存。

container_network_receive_bytes_total

counter

容器网络累积接收字节数

container_network_transmit_bytes_total

counter

容器网络累积传输字节数

container_network_receive_packets_total

counter

容器网络收到的累计数据包数

container_network_transmit_packets_total

counter

容器网络传输的累计数据包数

container_network_receive_packets_dropped_total

counter

容器网络接收时丢失的数据包数

container_network_transmit_packets_dropped_total

counter

容器网络传输时丢失的数据包数

container_fs_reads_total

counter

容器磁盘读取次数

container_fs_reads_bytes_total

counter

容器磁盘读取的总字节数

相关文档