容器组件指标及其维度
指标名称 |
指标含义 |
取值范围 |
单位 |
---|---|---|---|
CPU内核总量(aom_container_cpu_limit_core) |
该指标用于统计测量对象限制的CPU核总量。 |
≥1 |
核(Core) |
CPU内核占用(aom_container_cpu_used_core) |
该指标用于统计测量对象已经使用的CPU核个数。 |
≥0 |
核(Core) |
CPU使用率(aom_container_cpu_usage) |
该指标用于统计测量对象的CPU使用率。服务实际使用的与限制的CPU核数量比率。 |
0~100 |
百分比(%) |
磁盘读取速率(aom_container_disk_read_kilobytes) |
该指标用于统计每秒从磁盘读出的数据量。 |
≥0 |
千字节/秒(kB/s) |
磁盘写入速率(aom_container_disk_write_kilobytes) |
该指标用于统计每秒写入磁盘的数据量。 |
≥0 |
千字节/秒(kB/s) |
文件系统可用(aom_container_filesystem_available_capacity_megabytes) |
该指标用于统计测量对象文件系统的可用大小。仅支持1.11及其更高版本的kubernetes集群中驱动模式为devicemapper的容器。 |
≥0 |
兆字节(MB) |
文件系统容量(aom_container_filesystem_capacity_megabytes) |
该指标用于统计测量对象文件系统的容量。仅支持1.11及其更高版本的kubernetes集群中驱动模式为devicemapper的容器。 |
≥0 |
兆字节(MB) |
文件系统使用率(aom_container_filesystem_usage) |
该指标用于统计测量对象文件系统使用率。实际使用量与文件系统容量的百分比。仅支持1.11及其更高版本的kubernetes集群中驱动模式为devicemapper的容器。 |
0~100 |
百分比(%) |
显存容量(aom_container_gpu_memory_free_megabytes) |
该指标用于统计测量对象的显存容量。 |
>0 |
兆字节(MB) |
显存使用率(aom_container_gpu_memory_usage) |
该指标用于统计测量对象已使用的显存占显存容量的百分比。 |
0~100 |
百分比(%) |
显存使用量(aom_container_gpu_memory_used_megabytes) |
该指标用于统计测量对象已使用的显存。 |
≥0 |
兆字节(MB) |
GPU使用率(aom_container_gpu_usage) |
该指标用于统计测量对象的GPU使用率。 |
0~100 |
百分比(%) |
NPU存储容量(aom_container_npu_memory_free_megabytes) |
该指标用于统计测量对象的NPU存储容量。 |
>0 |
兆字节(MB) |
NPU存储使用率(aom_container_npu_memory_usage) |
该指标用于统计测量对象已使用的NPU存储占NPU存储容量的百分比。 |
0~100 |
百分比(%) |
NPU存储使用量(aom_container_npu_memory_used_megabytes) |
该指标用于统计测量对象已使用的NPU存储。 |
≥0 |
兆字节(MB) |
NPU使用率(aom_container_npu_usage) |
该指标用于统计测量对象的NPU使用率。 |
0~100 |
百分比(%) |
物理内存总量(aom_container_memory_request_megabytes) |
该指标用于统计测量对象限制的物理内存总量。 |
≥0 |
兆字节(MB) |
物理内存使用率(aom_container_memory_usage) |
该指标用于统计测量对象已使用内存占限制物理内存总量的百分比。 |
0~100 |
百分比(%) |
物理内存使用量(aom_container_memory_used_megabytes) |
该指标用于统计测量对象实际已经使用的物理内存(Resident Set Size)。 |
≥0 |
兆字节(MB) |
下行Bps(aom_container_network_receive_bytes) |
该指标用于统计测试对象的入方向网络流速。 |
≥0 |
字节/秒(Byte/s) |
下行Pps(aom_container_network_receive_packets) |
每秒网卡接收的数据包个数。 |
≥0 |
个/秒(Packet/s) |
下行错包率(aom_container_network_receive_error_packets) |
每秒网卡接收的错误包个数。 |
≥0 |
个/秒(Count/s) |
容器错包个数(aom_container_network_rx_error_packets) |
该指标用于统计测量对象收到错误包的数量。 |
≥0 |
个(Count) |
上行Bps(aom_container_network_transmit_bytes) |
该指标用于统计测试对象的出方向网络流速。 |
≥0 |
字节/秒(Byte/s) |
上行错包率(aom_container_network_transmit_error_packets) |
每秒网卡发送的错误包个数。 |
≥0 |
个/秒(Count/s) |
上行Pps(aom_container_network_transmit_packets) |
每秒网卡发送的数据包个数。 |
≥0 |
个/秒(Packet/s) |
状态(aom_process_status) |
该指标用于统计Docker容器状态是否正常。 |
0、1
|
无 |
workingset的使用率(aom_container_memory_workingset_usage) |
该指标用于统计该内存workingset的使用率。 |
0~100 |
百分比(%) |
内存workingset使用量(aom_container_memory_workingset_used_megabytes ) |
该指标用于统计该内存workingset的使用量,即RSS内存和缓存的总和。 |
≥0 |
兆字节(MB) |
维度 |
说明 |
---|---|
appID |
服务ID。 |
appName |
服务名称。 |
clusterId |
集群ID。 |
clusterName |
集群名称。 |
containerID |
容器ID。 |
containerName |
容器名称。 |
deploymentName |
k8s Deployment名称。 |
kind |
应用类型。 |
nameSpace |
集群的命名空间。 |
podID |
实例ID。 |
podName |
实例名称。 |
serviceID |
存量ID。 |
gpuID |
GPU ID。 |
npuName |
NPU名称。 |
npuID |
NPU ID。 |