更新时间:2024-08-05 GMT+08:00

基础指标:虚机指标

介绍通过ICAgent上报到AOM的虚机指标的类别、名称、含义等信息。

表1 虚机指标说明

指标类别

指标

指标名称

指标含义

取值范围

单位

网络指标

aom_node_network_receive_bytes

下行Bps

该指标用于统计测试对象的入方向网络流速。

≥0

字节/秒(Byte/s)

aom_node_network_receive_packets

下行Pps

每秒网卡接收的数据包个数。

≥0

个/秒(Packet/s)

aom_node_network_receive_error_packets

下行错包率

每秒网卡接收的错误包个数。

≥0

个/秒(Count/s)

aom_node_network_transmit_bytes

上行Bps

该指标用于统计测试对象的出方向网络流速。

≥0

字节/秒(Byte/s)

aom_node_network_transmit_error_packets

上行错包率

每秒网卡发送的错误包个数。

≥0

个/秒(Count/s)

aom_node_network_transmit_packets

上行Pps

每秒网卡发送的数据包个数。

≥0

个/秒(Packet/s)

aom_node_network_total_bytes

总Bps

该指标用于统计测试对象出方向和入方向的网络流速之和。

≥0

字节/秒(Byte/s)

磁盘指标

aom_node_disk_read_kilobytes

磁盘读取速率

该指标用于统计每秒从磁盘读出的数据量。

≥0

千字节/秒(kB/s)

aom_node_disk_write_kilobytes

磁盘写入速率

该指标用于统计每秒写入磁盘的数据量。

≥0

千字节/秒(kB/s)

磁盘分区指标

aom_host_diskpartition_thinpool_metadata_percent

Thin pool 元数据空间使用率

该指标用于统计CCE节点上thinpool元数据空间使用百分比。

0~100

百分比(%)

aom_host_diskpartition_thinpool_data_percent

Thin pool 数据空间使用率

该指标用于统计CCE节点上thinpool数据空间使用百分比。

0~100

百分比(%)

aom_host_diskpartition_total_capacity_megabytes

Thin pool 磁盘分区容量

该指标用于统计CCE节点上thinpool总空间容量。

≥0

兆字节(MB)

文件系统指标

aom_node_disk_available_capacity_megabytes

可用磁盘空间

还未经使用的磁盘空间。

≥0

兆字节(MB)

aom_node_disk_capacity_megabytes

磁盘空间容量

总的磁盘空间容量。

≥0

兆字节(MB)

aom_node_disk_rw_status

磁盘读写状态

该指标用于统计主机上磁盘的读写状态。

0、1

  • 0表示读写
  • 1表示只读

aom_node_disk_usage

磁盘使用率

已使用的磁盘空间占总的磁盘空间容量百分比。

0~100

百分比(%)

主机指标

aom_node_cpu_limit_core

CPU内核总量

该指标用于统计测量对象申请的CPU核总量。

≥1

核(Core)

aom_node_cpu_used_core

CPU内核占用

该指标用于统计测量对象已经使用的CPU核个数。

≥0

核(Core)

aom_node_cpu_usage

CPU使用率

该指标用于统计测量对象的CPU使用率。

0~100

百分比(%)

aom_node_memory_free_megabytes

可用物理内存

该指标用于统计测量对象上的尚未被使用的物理内存。

≥0

兆字节(MB)

aom_node_virtual_memory_free_megabytes

可用虚拟内存

该指标用于统计测量对象上的尚未被使用的虚拟内存。

≥0

兆字节(MB)

aom_node_gpu_memory_free_megabytes

显存容量

该指标用于统计测量对象的显存容量。

>0

兆字节(MB)

aom_node_gpu_memory_usage

显存使用率

该指标用于统计测量对象已使用的显存占显存容量的百分比。

0~100

百分比(%)

aom_node_gpu_memory_used_megabytes

显存使用量

该指标用于统计测量对象已使用的显存。

≥0

兆字节(MB)

aom_node_gpu_usage

GPU使用率

该指标用于统计测量对象的GPU使用率。

0~100

百分比(%)

aom_node_npu_memory_free_megabytes

NPU存储容量

该指标用于统计测量对象的NPU存储容量。

>0

兆字节(MB)

aom_node_npu_memory_usage

NPU存储使用率

该指标用于统计测量对象已使用的NPU存储占NPU存储容量的百分比。

0~100

百分比(%)

aom_node_npu_memory_used_megabytes

NPU存储使用量

该指标用于统计测量对象已使用的NPU存储。

≥0

兆字节(MB)

aom_node_npu_usage

NPU使用率

该指标用于统计测量对象的NPU使用率。

0~100

百分比(%)

aom_node_npu_temperature_centigrade

NPU温度

该指标用于统计NPU的温度。

-

摄氏度(℃)

aom_node_memory_usage

物理内存使用率

该指标用于统计测量对象已使用内存占申请物理内存总量的百分比。

0~100

百分比(%)

aom_node_status

主机状态

该指标用于统计主机状态是否正常。

  • 0表示正常
  • 1表示异常

aom_node_ntp_offset_ms

NTP偏移量

该指标用于统计主机本地时间与NTP服务器时间的偏移量,NTP偏移量越接近于0,主机本地时间与NTP服务器时间越接近。

-

毫秒(ms)

aom_node_ntp_server_status

NTP服务器状态

该指标用于统计主机是否成功连接上NTP服务器。

0、1

  • 0表示已连接
  • 1表示未连接

aom_node_ntp_status

NTP同步状态

该指标用于统计主机本地时间与NTP服务器时间是否同步。

0、1

  • 0表示同步
  • 1表示未同步

aom_node_process_number

进程数量

该指标用于统计测量对象上的进程数量。

≥0

aom_node_gpu_temperature_centigrade

显卡温度

该指标用于统计显卡的温度。

-

摄氏度(℃)

aom_node_memory_total_megabytes

物理内存容量

该指标用于统计测量申请的物理内存总量。

≥0

兆字节(MB)

aom_node_virtual_memory_total_megabytes

虚拟内存容量

该指标用于统计测量对象上的虚拟内存总量。

≥0

兆字节(MB)

aom_node_virtual_memory_usage

虚拟内存使用率

该指标用于统计测量对象已使用虚拟内存占虚拟内存总量的百分比。

0~100

百分比(%)

aom_node_current_threads_num

当前线程数量

该指标用于统计主机中当前创建的线程数量。

≥0

aom_node_sys_max_threads_num

最大线程数量

该指标用于统计主机最大可创建的线程数量。

≥0

aom_node_phy_disk_total_capacity_megabytes

物理磁盘总容量

该指标用于统计主机的磁盘总容量。

≥0

兆字节(MB)

aom_node_physical_disk_total_used_megabytes

物理磁盘已使用总容量

该指标用于统计主机已使用的磁盘总容量。

≥0

兆字节(MB)

aom_billing_hostUsed

主机数量

一天内接入的主机数量。

≥0

集群指标

aom_cluster_cpu_limit_core

CPU内核总量

该指标用于统计测量对象申请的CPU核总量。

≥1

核(Core)

aom_cluster_cpu_used_core

CPU内核占用

该指标用于统计测量对象已经使用的CPU核数。

≥0

核(Core)

aom_cluster_cpu_usage

CPU使用率

该指标用于统计测量对象的CPU使用率。

0~100

百分比(%)

aom_cluster_disk_available_capacity_megabytes

可用磁盘空间

还未经使用的磁盘空间。

≥0

兆字节(MB)

aom_cluster_disk_capacity_megabytes

磁盘空间容量

总的磁盘空间容量。

≥0

兆字节(MB)

aom_cluster_disk_usage

磁盘使用率

已使用的磁盘空间占总的磁盘空间容量百分比。

0~100

百分比(%)

aom_cluster_memory_free_megabytes

可用物理内存

该指标用于统计测量对象上的尚未被使用的物理内存。

≥0

兆字节(MB)

aom_cluster_virtual_memory_free_megabytes

可用虚拟内存

该指标用于统计测量对象上的尚未被使用的虚拟内存。

≥0

兆字节(MB)

aom_cluster_gpu_memory_free_megabytes

显存可用量

该指标用于统计测量对象的显存可用量。

>0

兆字节(MB)

aom_cluster_gpu_memory_usage

显存使用率

该指标用于统计测量对象已使用的显存占显存容量的百分比。

0~100

百分比(%)

aom_cluster_gpu_memory_used_megabytes

显存已使用量

该指标用于统计测量对象已使用的显存。

≥0

兆字节(MB)

aom_cluster_gpu_usage

GPU使用率

该指标用于统计测量对象的GPU使用率。

0~100

百分比(%)

aom_cluster_memory_usage

物理内存使用率

该指标用于统计测量对象已使用内存占申请物理内存总量的百分比。

0~100

百分比(%)

aom_cluster_network_receive_bytes

下行Bps

该指标用于统计测试对象的入方向网络流速。

≥0

字节/秒(Byte/s)

aom_cluster_network_transmit_bytes

上行Bps

该指标用于统计测试对象的出方向网络流速。

≥0

字节/秒(Byte/s)

aom_cluster_memory_total_megabytes

物理内存容量

该指标用于统计测量申请的物理内存总量。

≥0

兆字节(MB)

aom_cluster_virtual_memory_total_megabytes

虚拟内存容量

该指标用于统计测量对象上的虚拟内存总量。

≥0

兆字节(MB)

aom_cluster_virtual_memory_usage

虚拟内存使用率

该指标用于统计测量对象已使用虚拟内存占虚拟内存总量的百分比。

0~100

百分比(%)

容器指标

aom_container_cpu_limit_core

CPU内核总量

该指标用于统计测量对象限制的CPU核总量。

≥1

核(Core)

aom_container_cpu_used_core

CPU内核占用

该指标用于统计测量对象已经使用的CPU核个数。

≥0

核(Core)

aom_container_cpu_usage

CPU使用率

该指标用于统计测量对象的CPU使用率。服务实际使用的与限制的CPU核数量比率。

0~100

百分比(%)

aom_container_disk_read_kilobytes

磁盘读取速率

该指标用于统计每秒从磁盘读出的数据量。

≥0

千字节/秒(kB/s)

aom_container_disk_write_kilobytes

磁盘写入速率

该指标用于统计每秒写入磁盘的数据量。

≥0

千字节/秒(kB/s)

aom_container_filesystem_available_capacity_megabytes

文件系统可用

该指标用于统计测量对象文件系统的可用大小。仅支持1.11及其更高版本的kubernetes集群中驱动模式为devicemapper的容器。

≥0

兆字节(MB)

aom_container_filesystem_capacity_megabytes

文件系统容量

该指标用于统计测量对象文件系统的容量。仅支持1.11及其更高版本的kubernetes集群中驱动模式为devicemapper的容器。

≥0

兆字节(MB)

aom_container_filesystem_usage

文件系统使用率

该指标用于统计测量对象文件系统使用率。实际使用量与文件系统容量的百分比。仅支持1.11及其更高版本的kubernetes集群中驱动模式为devicemapper的容器。

0~100

百分比(%)

aom_container_gpu_memory_free_megabytes

显存容量

该指标用于统计测量对象的显存容量。

>0

兆字节(MB)

aom_container_gpu_memory_usage

显存使用率

该指标用于统计测量对象已使用的显存占显存容量的百分比。

0~100

百分比(%)

aom_container_gpu_memory_used_megabytes

显存使用量

该指标用于统计测量对象已使用的显存。

≥0

兆字节(MB)

aom_container_gpu_usage

GPU使用率

该指标用于统计测量对象的GPU使用率。

0~100

百分比(%)

aom_container_npu_memory_free_megabytes

NPU存储容量

该指标用于统计测量对象的NPU存储容量。

>0

兆字节(MB)

aom_container_npu_memory_usage

NPU存储使用率

该指标用于统计测量对象已使用的NPU存储占NPU存储容量的百分比。

0~100

百分比(%)

aom_container_npu_memory_used_megabytes

NPU存储使用量

该指标用于统计测量对象已使用的NPU存储。

≥0

兆字节(MB)

aom_container_npu_usage

NPU使用率

该指标用于统计测量对象的NPU使用率。

0~100

百分比(%)

aom_container_memory_request_megabytes

物理内存总量

该指标用于统计测量对象限制的物理内存总量。

≥0

兆字节(MB)

aom_container_memory_usage

物理内存使用率

该指标用于统计测量对象已使用内存占限制物理内存总量的百分比。

0~100

百分比(%)

aom_container_memory_used_megabytes

物理内存使用量

该指标用于统计测量对象实际已经使用的物理内存(Resident Set Size)。

≥0

兆字节(MB)

aom_container_network_receive_bytes

下行Bps

该指标用于统计测试对象的入方向网络流速。

≥0

字节/秒(Byte/s)

aom_container_network_receive_packets

下行Pps

每秒网卡接收的数据包个数。

≥0

个/秒(Packet/s)

aom_container_network_receive_error_packets

下行错包率

每秒网卡接收的错误包个数。

≥0

个/秒(Count/s)

aom_container_network_rx_error_packets

容器错包个数

该指标用于统计测量对象收到错误包的数量。

≥0

个(Count)

aom_container_network_transmit_bytes

上行Bps

该指标用于统计测试对象的出方向网络流速。

≥0

字节/秒(Byte/s)

aom_container_network_transmit_error_packets

上行错包率

每秒网卡发送的错误包个数。

≥0

个/秒(Count/s)

aom_container_network_transmit_packets

上行Pps

每秒网卡发送的数据包个数。

≥0

个/秒(Packet/s)

aom_process_status

状态

该指标用于统计Docker容器状态是否正常。

0、1

  • 0表示正常
  • 1表示异常

aom_container_memory_workingset_usage

workingset的使用率

该指标用于统计该内存workingset的使用率。

0~100

百分比(%)

aom_container_memory_workingset_used_megabytes

内存workingset使用量

该指标用于统计该内存workingset的使用量。

≥0

兆字节(MB)

进程指标

aom_process_cpu_limit_core

CPU内核总量

该指标用于统计测量对象申请的CPU核总量。

≥1

核(Core)

aom_process_cpu_used_core

CPU内核占用

该指标用于统计测量对象已经使用的CPU核个数。

≥0

核(Core)

aom_process_cpu_usage

CPU使用率

该指标用于统计测量对象的CPU使用率。服务实际使用的与申请的CPU核数量比率。

0~100

百分比(%)

aom_process_handle_count

句柄数

该指标用于统计测量对象使用的句柄数。

≥0

aom_process_max_handle_count

最大句柄数

该指标用于统计测量对象使用的最大句柄数。

≥0

aom_process_memory_request_megabytes

物理内存总量

该指标用于统计测量对象申请的物理内存总量。

≥0

兆字节(MB)

aom_process_memory_usage

物理内存使用率

该指标用于统计测量对象已使用内存占申请物理内存总量的百分比。

0~100

百分比(%)

aom_process_memory_used_megabytes

物理内存使用量

该指标用于统计测量对象实际已经使用的物理内存(Resident Set Size)。

≥0

兆字节(MB)

aom_process_status

状态

该指标用于统计进程状态是否正常。

0、1

  • 0表示正常
  • 1表示异常

aom_process_thread_count

线程数

该指标用于统计测量对象使用的线程数。

≥0

aom_process_virtual_memory_total_megabytes

虚拟内存总量

该指标用于统计测量对象申请的虚拟内存总量。

≥0

兆字节(MB)

  • 当主机类型为“CCE”时,可以查看磁盘分区指标,支持的系统为:CentOS 7.6版本、EulerOS 2.5。
  • 以root用户登录CCE节点,执行docker info | grep 'Storage Driver'命令查看docker存储驱动类型。如果执行结果为“Device Mapper ”,表示驱动类型为Device Mapper ,则支持查看磁盘分区thinpool指标。如果执行结果不为“Device Mapper”,则不支持查看磁盘分区thinpool指标。
  • 内存使用率 = (物理内存容量 - 可用物理内存) / 物理内存容量;虚拟内存使用率 = ((物理内存容量 + 虚拟内存总量) - (可用物理内存 + 可用虚拟内存)) / (物理内存容量 + 虚拟内存总量)。目前创建的虚机默认虚拟内存为0,在未配置虚拟内存的情况下,监控页面内存使用率,虚拟内存使用率相同。
  • 物理磁盘已使用总容量和物理磁盘总容量指标仅统计本地磁盘分区的文件系统类型,不统计主机通过网络形式挂载的文件系统(juicefs、nfs、smb等)。
  • 集群指标由AOM通过主机指标汇聚,汇聚的集群指标不包含master节点的主机指标。