更新时间:2024-05-09 GMT+08:00

容器组件指标及其维度

表1 容器指标

指标名称

指标含义

取值范围

单位

CPU内核总量(aom_container_cpu_limit_core)

该指标用于统计测量对象限制的CPU核总量。

≥1

核(Core)

CPU内核占用(aom_container_cpu_used_core)

该指标用于统计测量对象已经使用的CPU核个数。

≥0

核(Core)

CPU使用率(aom_container_cpu_usage)

该指标用于统计测量对象的CPU使用率。服务实际使用的与限制的CPU核数量比率。

0~100

百分比(%)

磁盘读取速率(aom_container_disk_read_kilobytes)

该指标用于统计每秒从磁盘读出的数据量。

≥0

千字节/秒(kB/s)

磁盘写入速率(aom_container_disk_write_kilobytes)

该指标用于统计每秒写入磁盘的数据量。

≥0

千字节/秒(kB/s)

文件系统可用(aom_container_filesystem_available_capacity_megabytes)

该指标用于统计测量对象文件系统的可用大小。仅支持1.11及其更高版本的kubernetes集群中驱动模式为devicemapper的容器。

≥0

兆字节(MB)

文件系统容量(aom_container_filesystem_capacity_megabytes)

该指标用于统计测量对象文件系统的容量。仅支持1.11及其更高版本的kubernetes集群中驱动模式为devicemapper的容器。

≥0

兆字节(MB)

文件系统使用率(aom_container_filesystem_usage)

该指标用于统计测量对象文件系统使用率。实际使用量与文件系统容量的百分比。仅支持1.11及其更高版本的kubernetes集群中驱动模式为devicemapper的容器。

0~100

百分比(%)

显存容量(aom_container_gpu_memory_free_megabytes)

该指标用于统计测量对象的显存容量。

>0

兆字节(MB)

显存使用率(aom_container_gpu_memory_usage)

该指标用于统计测量对象已使用的显存占显存容量的百分比。

0~100

百分比(%)

显存使用量(aom_container_gpu_memory_used_megabytes)

该指标用于统计测量对象已使用的显存。

≥0

兆字节(MB)

GPU使用率(aom_container_gpu_usage)

该指标用于统计测量对象的GPU使用率。

0~100

百分比(%)

NPU存储容量(aom_container_npu_memory_free_megabytes)

该指标用于统计测量对象的NPU存储容量。

>0

兆字节(MB)

NPU存储使用率(aom_container_npu_memory_usage)

该指标用于统计测量对象已使用的NPU存储占NPU存储容量的百分比。

0~100

百分比(%)

NPU存储使用量(aom_container_npu_memory_used_megabytes)

该指标用于统计测量对象已使用的NPU存储。

≥0

兆字节(MB)

NPU使用率(aom_container_npu_usage)

该指标用于统计测量对象的NPU使用率。

0~100

百分比(%)

物理内存总量(aom_container_memory_request_megabytes)

该指标用于统计测量对象限制的物理内存总量。

≥0

兆字节(MB)

物理内存使用率(aom_container_memory_usage)

该指标用于统计测量对象已使用内存占限制物理内存总量的百分比。

0~100

百分比(%)

物理内存使用量(aom_container_memory_used_megabytes)

该指标用于统计测量对象实际已经使用的物理内存(Resident Set Size)。

≥0

兆字节(MB)

下行Bps(aom_container_network_receive_bytes)

该指标用于统计测试对象的入方向网络流速。

≥0

字节/秒(Byte/s)

下行Pps(aom_container_network_receive_packets)

每秒网卡接收的数据包个数。

≥0

个/秒(Packet/s)

下行错包率(aom_container_network_receive_error_packets)

每秒网卡接收的错误包个数。

≥0

个/秒(Count/s)

容器错包个数(aom_container_network_rx_error_packets)

该指标用于统计测量对象收到错误包的数量。

≥0

个(Count)

上行Bps(aom_container_network_transmit_bytes)

该指标用于统计测试对象的出方向网络流速。

≥0

字节/秒(Byte/s)

上行错包率(aom_container_network_transmit_error_packets)

每秒网卡发送的错误包个数。

≥0

个/秒(Count/s)

上行Pps(aom_container_network_transmit_packets)

每秒网卡发送的数据包个数。

≥0

个/秒(Packet/s)

状态(aom_process_status)

该指标用于统计Docker容器状态是否正常。

0、1

  • 0表示正常
  • 1表示异常

workingset的使用率(aom_container_memory_workingset_usage)

该指标用于统计该内存workingset的使用率。

0~100

百分比(%)

内存workingset使用量(aom_container_memory_workingset_used_megabytes )

该指标用于统计该内存workingset的使用量,即RSS内存和缓存的总和。

≥0

兆字节(MB)

表2 容器指标维度

维度

说明

appID

服务ID。

appName

服务名称。

clusterId

集群ID。

clusterName

集群名称。

containerID

容器ID。

containerName

容器名称。

deploymentName

k8s Deployment名称。

kind

应用类型。

nameSpace

集群的命名空间。

podID

实例ID。

podName

实例名称。

serviceID

存量ID。

gpuID

GPU ID。

npuName

NPU名称。

npuID

NPU ID。