容器组件指标及其维度
指标名称 | 指标含义 | 取值范围 | 单位 |
|---|---|---|---|
CPU内核总量(aom_container_cpu_limit_core) | 该指标用于统计测量对象限制的CPU核总量。 | ≥1 | 核(Core) |
CPU内核占用(aom_container_cpu_used_core) | 该指标用于统计测量对象已经使用的CPU核个数。 | ≥0 | 核(Core) |
CPU使用率(aom_container_cpu_usage) | 该指标用于统计测量对象的CPU使用率。服务实际使用的与限制的CPU核数量比率。 | 0~100 | 百分比(%) |
磁盘读取速率(aom_container_disk_read_kilobytes) | 该指标用于统计每秒从磁盘读出的数据量。 | ≥0 | 千字节/秒(kB/s) |
磁盘写入速率(aom_container_disk_write_kilobytes) | 该指标用于统计每秒写入磁盘的数据量。 | ≥0 | 千字节/秒(kB/s) |
文件系统可用(aom_container_filesystem_available_capacity_megabytes) | 该指标用于统计测量对象文件系统的可用大小。仅支持1.11及其更高版本的kubernetes集群中驱动模式为devicemapper的容器。 | ≥0 | 兆字节(MB) |
文件系统容量(aom_container_filesystem_capacity_megabytes) | 该指标用于统计测量对象文件系统的容量。仅支持1.11及其更高版本的kubernetes集群中驱动模式为devicemapper的容器。 | ≥0 | 兆字节(MB) |
文件系统使用率(aom_container_filesystem_usage) | 该指标用于统计测量对象文件系统使用率。实际使用量与文件系统容量的百分比。仅支持1.11及其更高版本的kubernetes集群中驱动模式为devicemapper的容器。 | 0~100 | 百分比(%) |
显存容量(aom_container_gpu_memory_free_megabytes) | 该指标用于统计测量对象的显存容量。 | >0 | 兆字节(MB) |
显存使用率(aom_container_gpu_memory_usage) | 该指标用于统计测量对象已使用的显存占显存容量的百分比。 | 0~100 | 百分比(%) |
显存使用量(aom_container_gpu_memory_used_megabytes) | 该指标用于统计测量对象已使用的显存。 | ≥0 | 兆字节(MB) |
GPU使用率(aom_container_gpu_usage) | 该指标用于统计测量对象的GPU使用率。 | 0~100 | 百分比(%) |
NPU存储容量(aom_container_npu_memory_free_megabytes) | 该指标用于统计测量对象的NPU存储容量。 | >0 | 兆字节(MB) |
NPU存储使用率(aom_container_npu_memory_usage) | 该指标用于统计测量对象已使用的NPU存储占NPU存储容量的百分比。 | 0~100 | 百分比(%) |
NPU存储使用量(aom_container_npu_memory_used_megabytes) | 该指标用于统计测量对象已使用的NPU存储。 | ≥0 | 兆字节(MB) |
NPU使用率(aom_container_npu_usage) | 该指标用于统计测量对象的NPU使用率。 | 0~100 | 百分比(%) |
物理内存总量(aom_container_memory_request_megabytes) | 该指标用于统计测量对象限制的物理内存总量。 | ≥0 | 兆字节(MB) |
物理内存使用率(aom_container_memory_usage) | 该指标用于统计测量对象已使用内存占限制物理内存总量的百分比。 | 0~100 | 百分比(%) |
物理内存使用量(aom_container_memory_used_megabytes) | 该指标用于统计测量对象实际已经使用的物理内存(Resident Set Size)。 | ≥0 | 兆字节(MB) |
下行Bps(aom_container_network_receive_bytes) | 该指标用于统计测试对象的入方向网络流速。 | ≥0 | 字节/秒(Byte/s) |
下行Pps(aom_container_network_receive_packets) | 每秒网卡接收的数据包个数。 | ≥0 | 个/秒(Packet/s) |
下行错包率(aom_container_network_receive_error_packets) | 每秒网卡接收的错误包个数。 | ≥0 | 个/秒(Count/s) |
容器错包个数(aom_container_network_rx_error_packets) | 该指标用于统计测量对象收到错误包的数量。 | ≥0 | 个(Count) |
上行Bps(aom_container_network_transmit_bytes) | 该指标用于统计测试对象的出方向网络流速。 | ≥0 | 字节/秒(Byte/s) |
上行错包率(aom_container_network_transmit_error_packets) | 每秒网卡发送的错误包个数。 | ≥0 | 个/秒(Count/s) |
上行Pps(aom_container_network_transmit_packets) | 每秒网卡发送的数据包个数。 | ≥0 | 个/秒(Packet/s) |
状态(aom_process_status) | 该指标用于统计Docker容器状态是否正常。 | 0、1
| 无 |
workingset的使用率(aom_container_memory_workingset_usage) | 该指标用于统计该内存workingset的使用率。 | 0~100 | 百分比(%) |
内存workingset使用量(aom_container_memory_workingset_used_megabytes ) | 该指标用于统计该内存workingset的使用量,即RSS内存和缓存的总和。 | ≥0 | 兆字节(MB) |
维度 | 说明 |
|---|---|
appID | 服务ID。 |
appName | 服务名称。 |
clusterId | 集群ID。 |
clusterName | 集群名称。 |
containerID | 容器ID。 |
containerName | 容器名称。 |
deploymentName | k8s Deployment名称。 |
kind | 应用类型。 |
nameSpace | 集群的命名空间。 |
podID | 实例ID。 |
podName | 实例名称。 |
serviceID | 存量ID。 |
gpuID | GPU ID。 |
npuName | NPU名称。 |
npuID | NPU ID。 |

