基础指标:虚机指标
介绍通过ICAgent上报到AOM的虚机指标的类别、名称、含义等信息。
- 当主机类型为“CCE”时,可以查看磁盘分区指标,支持的系统为:CentOS 7.6版本、EulerOS 2.5。
- 以root用户登录CCE节点,执行docker info | grep 'Storage Driver'命令查看docker存储驱动类型。如果执行结果为“Device Mapper ”,表示驱动类型为Device Mapper ,则支持查看磁盘分区Thinpool指标。如果执行结果不为“Device Mapper”,则不支持查看磁盘分区Thin pool指标。
- 内存使用率 =(物理内存容量 - 可用物理内存) / 物理内存容量;虚拟内存使用率 =((物理内存容量 + 虚拟内存总量) - (可用物理内存 + 可用虚拟内存)) / (物理内存容量 + 虚拟内存总量)。目前创建的虚机默认虚拟内存为0,在未配置虚拟内存的情况下,监控页面内存使用率,虚拟内存使用率相同。
- 物理磁盘已使用总容量和物理磁盘总容量指标仅统计本地磁盘分区的文件系统类型,不统计主机通过网络形式挂载的文件系统(juicefs、nfs、smb等)。
- 集群指标由AOM通过主机指标汇聚,汇聚的集群指标不包含master节点的主机指标。
指标类别 | 指标 | 指标名称 | 指标含义 | 取值范围 | 单位 |
|---|---|---|---|---|---|
网络指标 | aom_node_network_receive_bytes | 下行Bps | 该指标用于统计测试对象的入方向网络流速。 | ≥0 | 字节/秒(Byte/s) |
aom_node_network_receive_packets | 下行Pps | 每秒网卡接收的数据包个数。 | ≥0 | 个/秒(Packet/s) | |
aom_node_network_receive_error_packets | 下行错包率 | 每秒网卡接收的错误包个数。 | ≥0 | 个/秒(Packet/s) | |
aom_node_network_transmit_bytes | 上行Bps | 该指标用于统计测试对象的出方向网络流速。 | ≥0 | 字节/秒(Byte/s) | |
aom_node_network_transmit_error_packets | 上行错包率 | 每秒网卡传输的错误包个数。 | ≥0 | 个/秒(Packet/s) | |
aom_node_network_transmit_packets | 上行Pps | 每秒网卡传输的数据包个数。 | ≥0 | 个/秒(Packet/s) | |
aom_node_network_total_bytes | 总Bps | 该指标用于统计测试对象出方向和入方向的网络流速之和。 | ≥0 | 字节/秒(Byte/s) | |
磁盘指标 | aom_node_disk_read_kilobytes | 磁盘读取速率 | 该指标用于统计每秒从磁盘读出的数据量。 | ≥0 | 千字节/秒(kB/s) |
aom_node_disk_write_kilobytes | 磁盘写入速率 | 该指标用于统计每秒写入磁盘的数据量。 | ≥0 | 千字节/秒(kB/s) | |
磁盘分区指标 | aom_host_diskpartition_thinpool_metadata_percent | Thin pool 元数据空间使用率 | 该指标用于统计CCE节点上Thin pool元数据空间使用百分比。 | 0~100 | 百分比(%) |
aom_host_diskpartition_thinpool_data_percent | Thin pool 数据空间使用率 | 该指标用于统计CCE节点上Thin pool数据空间使用百分比。 | 0~100 | 百分比(%) | |
aom_host_diskpartition_total_capacity_megabytes | Thin pool 磁盘分区容量 | 该指标用于统计CCE节点上Thin pool总空间容量。 | ≥0 | 兆字节(MB) | |
文件系统指标 | aom_node_disk_available_capacity_megabytes | 可用磁盘空间 | 还未经使用的磁盘空间。 | ≥0 | 兆字节(MB) |
aom_node_disk_capacity_megabytes | 磁盘空间容量 | 总的磁盘空间容量。 | ≥0 | 兆字节(MB) | |
aom_node_disk_rw_status | 磁盘读写状态 | 该指标用于统计主机上磁盘的读写状态。 | 0、1
| 无 | |
aom_node_disk_usage | 磁盘使用率 | 已使用的磁盘空间占总的磁盘空间容量百分比。 | 0~100 | 百分比(%) | |
主机指标 | aom_node_cpu_limit_core | CPU内核总量 | 该指标用于统计测量对象申请的CPU核总量。 | ≥1 | 核(Core) |
aom_node_cpu_used_core | CPU内核占用 | 该指标用于统计测量对象已经使用的CPU核个数。 | ≥0 | 核(Core) | |
aom_node_cpu_usage | CPU使用率 | 该指标用于统计测量对象的CPU使用率。 | 0~100 | 百分比(%) | |
aom_node_memory_free_megabytes | 可用物理内存 | 该指标用于统计测量对象上的尚未被使用的物理内存。 | ≥0 | 兆字节(MB) | |
aom_node_virtual_memory_free_megabytes | 可用虚拟内存 | 该指标用于统计测量对象上的尚未被使用的虚拟内存。 | ≥0 | 兆字节(MB) | |
aom_node_gpu_memory_free_megabytes | 显存容量 | 该指标用于统计测量对象的显存容量。 | >0 | 兆字节(MB) | |
aom_node_gpu_memory_usage | 显存使用率 | 该指标用于统计测量对象已使用的显存占显存容量的百分比。 | 0~100 | 百分比(%) | |
aom_node_gpu_memory_used_megabytes | 显存使用量 | 该指标用于统计测量对象已使用的显存。 | ≥0 | 兆字节(MB) | |
aom_node_gpu_usage | GPU使用率 | 该指标用于统计测量对象的GPU使用率。 | 0~100 | 百分比(%) | |
aom_node_npu_memory_free_megabytes | NPU存储容量 | 该指标用于统计测量对象的NPU存储容量。 仅支持CCE类型主机的NPU指标采集。 | >0 | 兆字节(MB) | |
aom_node_npu_memory_usage | NPU存储使用率 | 该指标用于统计测量对象已使用的NPU存储占NPU存储容量的百分比。 仅支持CCE类型主机的NPU指标采集。 | 0~100 | 百分比(%) | |
aom_node_npu_memory_used_megabytes | NPU存储使用量 | 该指标用于统计测量对象已使用的NPU存储。 仅支持CCE类型主机的NPU指标采集。 | ≥0 | 兆字节(MB) | |
aom_node_npu_usage | NPU使用率 | 该指标用于统计测量对象的NPU使用率。 仅支持CCE类型主机的NPU指标采集。 | 0~100 | 百分比(%) | |
aom_node_npu_temperature_centigrade | NPU温度 | 该指标用于统计NPU的温度。 仅支持CCE类型主机的NPU指标采集。 | - | 摄氏度(℃) | |
aom_node_memory_usage | 物理内存使用率 | 该指标用于统计测量对象已使用内存占申请的物理内存总量的百分比。 | 0~100 | 百分比(%) | |
aom_node_ntp_offset_ms | NTP偏移量 | 该指标用于统计主机本地时间与NTP服务器时间的偏移量,NTP偏移量越接近于0,主机本地时间与NTP服务器时间越接近。 | - | 毫秒(ms) | |
aom_node_ntp_server_status | NTP服务器状态 | 该指标用于统计主机是否成功连接上NTP服务器。 | 0、1
| 无 | |
aom_node_ntp_status | NTP同步状态 | 该指标用于统计主机本地时间与NTP服务器时间是否同步。 | 0、1
| 无 | |
aom_node_process_number | 进程数量 | 该指标用于统计测量对象上的进程数量。 | ≥0 | 个(Count) | |
aom_node_gpu_temperature_centigrade | 显卡温度 | 该指标用于统计显卡的温度。 | - | 摄氏度(℃) | |
aom_node_memory_total_megabytes | 物理内存容量 | 该指标用于统计测量申请的物理内存总量。 | ≥0 | 兆字节(MB) | |
aom_node_virtual_memory_total_megabytes | 虚拟内存容量 | 该指标用于统计测量对象上的虚拟内存总量。 | ≥0 | 兆字节(MB) | |
aom_node_virtual_memory_usage | 虚拟内存使用率 | 该指标用于统计测量对象已使用虚拟内存占虚拟内存总量的百分比。 | 0~100 | 百分比(%) | |
aom_node_current_threads_num | 当前线程数量 | 该指标用于统计主机中当前创建的线程数量。 | ≥0 | 个(Count) | |
aom_node_sys_max_threads_num | 最大线程数量 | 该指标用于统计主机最大可创建的线程数量。 | ≥0 | 个(Count) | |
aom_node_phy_disk_total_capacity_megabytes | 物理磁盘总容量 | 该指标用于统计主机的磁盘总容量。 | ≥0 | 兆字节(MB) | |
aom_node_physical_disk_total_used_megabytes | 物理磁盘已使用总容量 | 该指标用于统计主机已使用的磁盘总容量。 | ≥0 | 兆字节(MB) | |
aom_billing_hostUsed | 主机数量 | 一天内接入的主机数量。 | ≥0 | 个(Count) | |
集群指标 | aom_cluster_cpu_limit_core | CPU内核总量 | 该指标用于统计测量对象申请的CPU核总量。 | ≥1 | 核(Core) |
aom_cluster_cpu_used_core | CPU内核占用 | 该指标用于统计测量对象已经使用的CPU核数。 | ≥0 | 核(Core) | |
aom_cluster_cpu_usage | CPU使用率 | 该指标用于统计测量对象的CPU使用率。 | 0~100 | 百分比(%) | |
aom_cluster_disk_available_capacity_megabytes | 可用磁盘空间 | 还未经使用的磁盘空间。 | ≥0 | 兆字节(MB) | |
aom_cluster_disk_capacity_megabytes | 磁盘空间容量 | 总的磁盘空间容量。 | ≥0 | 兆字节(MB) | |
aom_cluster_disk_usage | 磁盘使用率 | 已使用的磁盘空间占总的磁盘空间容量百分比。 | 0~100 | 百分比(%) | |
aom_cluster_memory_free_megabytes | 可用物理内存 | 该指标用于统计测量对象上的尚未被使用的物理内存。 | ≥0 | 兆字节(MB) | |
aom_cluster_virtual_memory_free_megabytes | 可用虚拟内存 | 该指标用于统计测量对象上的尚未被使用的虚拟内存。 | ≥0 | 兆字节(MB) | |
aom_cluster_gpu_memory_free_megabytes | 显存可用量 | 该指标用于统计测量对象的显存可用量。 | >0 | 兆字节(MB) | |
aom_cluster_gpu_memory_usage | 显存使用率 | 该指标用于统计测量对象已使用的显存占显存容量的百分比。 | 0~100 | 百分比(%) | |
aom_cluster_gpu_memory_used_megabytes | 显存已使用量 | 该指标用于统计测量对象已使用的显存。 | ≥0 | 兆字节(MB) | |
aom_cluster_gpu_usage | GPU使用率 | 该指标用于统计测量对象的GPU使用率。 | 0~100 | 百分比(%) | |
aom_cluster_memory_usage | 物理内存使用率 | 该指标用于统计测量对象已使用内存占申请物理内存总量的百分比。 | 0~100 | 百分比(%) | |
aom_cluster_network_receive_bytes | 下行Bps | 该指标用于统计测试对象的入方向网络流速。 | ≥0 | 字节/秒(Byte/s) | |
aom_cluster_network_transmit_bytes | 上行Bps | 该指标用于统计测试对象的出方向网络流速。 | ≥0 | 字节/秒(Byte/s) | |
aom_cluster_memory_total_megabytes | 物理内存容量 | 该指标用于统计测量申请的物理内存总量。 | ≥0 | 兆字节(MB) | |
aom_cluster_virtual_memory_total_megabytes | 虚拟内存容量 | 该指标用于统计测量对象上的虚拟内存总量。 | ≥0 | 兆字节(MB) | |
aom_cluster_virtual_memory_usage | 虚拟内存使用率 | 该指标用于统计测量对象已使用虚拟内存占虚拟内存总量的百分比。 | 0~100 | 百分比(%) | |
容器指标 | aom_container_cpu_limit_core | CPU内核总量 | 该指标用于统计测量对象限制的CPU核总量。 | ≥1 | 核(Core) |
aom_container_cpu_used_core | CPU内核占用 | 该指标用于统计测量对象已经使用的CPU核个数。 | ≥0 | 核(Core) | |
aom_container_cpu_usage | CPU使用率 | 该指标用于统计测量对象的CPU使用率。服务实际使用的与限制的CPU核数量比率。 | 0~100 | 百分比(%) | |
aom_container_disk_read_kilobytes | 磁盘读取速率 | 该指标用于统计每秒从磁盘读出的数据量。 | ≥0 | 千字节/秒(kB/s) | |
aom_container_disk_write_kilobytes | 磁盘写入速率 | 该指标用于统计每秒写入磁盘的数据量。 | ≥0 | 千字节/秒(kB/s) | |
aom_container_filesystem_available_capacity_megabytes | 文件系统可用 | 该指标用于统计测量对象文件系统的可用大小。仅支持1.11及其更高版本的kubernetes集群中驱动模式为devicemapper的容器。 | ≥0 | 兆字节(MB) | |
aom_container_filesystem_capacity_megabytes | 文件系统容量 | 该指标用于统计测量对象文件系统的容量。仅支持1.11及其更高版本的kubernetes集群中驱动模式为devicemapper的容器。 | ≥0 | 兆字节(MB) | |
aom_container_filesystem_usage | 文件系统使用率 | 该指标用于统计测量对象文件系统使用率。实际使用量与文件系统容量的百分比。仅支持1.11及其更高版本的kubernetes集群中驱动模式为devicemapper的容器。 | 0~100 | 百分比(%) | |
aom_container_gpu_memory_free_megabytes | 显存容量 | 该指标用于统计测量对象的显存容量。 | >0 | 兆字节(MB) | |
aom_container_gpu_memory_usage | 显存使用率 | 该指标用于统计测量对象已使用的显存占显存容量的百分比。 | 0~100 | 百分比(%) | |
aom_container_gpu_memory_used_megabytes | 显存使用量 | 该指标用于统计测量对象已使用的显存。 | ≥0 | 兆字节(MB) | |
aom_container_gpu_usage | GPU使用率 | 该指标用于统计测量对象的GPU使用率。 | 0~100 | 百分比(%) | |
aom_container_npu_memory_free_megabytes | NPU存储容量 | 该指标用于统计测量对象的NPU存储容量。 | >0 | 兆字节(MB) | |
aom_container_npu_memory_usage | NPU存储使用率 | 该指标用于统计测量对象已使用的NPU存储占NPU存储容量的百分比。 | 0~100 | 百分比(%) | |
aom_container_npu_memory_used_megabytes | NPU存储使用量 | 该指标用于统计测量对象已使用的NPU存储。 | ≥0 | 兆字节(MB) | |
aom_container_npu_usage | NPU使用率 | 该指标用于统计测量对象的NPU使用率。 | 0~100 | 百分比(%) | |
aom_container_memory_request_megabytes | 物理内存总量 | 该指标用于统计测量对象限制的物理内存总量。 | ≥0 | 兆字节(MB) | |
aom_container_memory_usage | 物理内存使用率 | 该指标用于统计测量对象已使用内存占限制物理内存总量的百分比。 | 0~100 | 百分比(%) | |
aom_container_memory_used_megabytes | 物理内存使用量 | 该指标用于统计测量对象实际已经使用的物理内存(Resident Set Size)。 | ≥0 | 兆字节(MB) | |
aom_container_network_receive_bytes | 下行Bps | 该指标用于统计测试对象的入方向网络流速。 | ≥0 | 字节/秒(Byte/s) | |
aom_container_network_receive_packets | 下行Pps | 每秒网卡接收的数据包个数。 | ≥0 | 个/秒(Packet/s) | |
aom_container_network_receive_error_packets | 下行错包率 | 每秒网卡接收的错误包个数。 | ≥0 | 个/秒(Packet/s) | |
aom_container_network_rx_error_packets | 容器错包个数 | 该指标用于统计测量对象收到错误包的数量。 | ≥0 | 个(Count) | |
aom_container_network_transmit_bytes | 上行Bps | 该指标用于统计测试对象的出方向网络流速。 | ≥0 | 字节/秒(Byte/s) | |
aom_container_network_transmit_error_packets | 上行错包率 | 每秒网卡传输的错误包个数。 | ≥0 | 个/秒(Packet/s) | |
aom_container_network_transmit_packets | 上行Pps | 每秒网卡传输的数据包个数。 | ≥0 | 个/秒(Packet/s) | |
aom_container_memory_workingset_usage | workingset的使用率 | 该指标用于统计该内存workingset的使用率。 | 0~100 | 百分比(%) | |
aom_container_memory_workingset_used_megabytes | 内存workingset使用量 | 该指标用于统计该内存workingset的使用量。 | ≥0 | 兆字节(MB) | |
进程指标 | aom_process_cpu_limit_core | CPU内核总量 | 该指标用于统计测量对象申请的CPU核总量。 | ≥1 | 核(Core) |
aom_process_cpu_used_core | CPU内核占用 | 该指标用于统计测量对象已经使用的CPU核数。 | ≥0 | 核(Core) | |
aom_process_cpu_usage | CPU使用率 | 该指标用于统计测量对象的CPU使用率。服务实际使用的与申请的CPU核数量比率。 | 0~100 | 百分比(%) | |
aom_process_handle_count | 句柄数 | 该指标用于统计测量对象使用的句柄数。 | ≥0 | 个(Count) | |
aom_process_max_handle_count | 最大句柄数 | 该指标用于统计测量对象使用的最大句柄数。 | ≥0 | 个(Count) | |
aom_process_memory_request_megabytes | 物理内存总量 | 该指标用于统计测量对象申请的物理内存总量。 | ≥0 | 兆字节(MB) | |
aom_process_memory_usage | 物理内存使用率 | 该指标用于统计测量对象已使用内存占申请物理内存总量的百分比。 | 0~100 | 百分比(%) | |
aom_process_memory_used_megabytes | 物理内存使用量 | 该指标用于统计测量对象实际已经使用的物理内存(Resident Set Size)。 | ≥0 | 兆字节(MB) | |
aom_process_thread_count | 线程数 | 该指标用于统计测量对象使用的线程数。 | ≥0 | 个(Count) | |
aom_process_virtual_memory_total_megabytes | 虚拟内存总量 | 该指标用于统计测量对象申请的虚拟内存总量。 | ≥0 | 兆字节(MB) |

