更新时间:2022-05-24 GMT+08:00
分享

Grafana普罗指标

表1 主机指标

指标名称

指标含义

取值范围

单位

下行Bps(aom_node_network_receive_bytes)

该指标用于统计测试对象的入方向网络流速。

≥0

字节/秒(Bytes/Second)

下行Pps(aom_node_network_receive_packets)

每秒网卡接收的数据包个数。

≥0

个/秒(Packets/Second)

下行错包率(aom_node_network_receive_error_packets)

每秒网卡接收的错误包个数。

≥0

个/秒(Packets/Second)

上行Bps(aom_node_network_transmit_bytes)

该指标用于统计测试对象的出方向网络流速。

≥0

字节/秒(Bytes/Second)

上行错包率

(aom_node_network_transmit_error_packets)

每秒网卡发送的错误包个数。

≥0

个/秒(Packets/Second)

上行Pps

(aom_node_network_transmit_packets)

每秒网卡发送的数据包个数。

≥0

个/秒(Packets/Second)

总Bps(aom_node_network_total_bytes)

该指标用于统计测试对象出方向和入方向的网络流速之和。

≥0

字节/秒(Bytes/Second)

磁盘读取速率(aom_node_disk_read_kilobytes)

该指标用于统计每秒从磁盘读出的数据量。

≥0

千字节/秒(Kilobytes/Second)

磁盘写入速率(aom_node_disk_write_kilobytes)

该指标用于统计每秒写入磁盘的数据量。

≥0

千字节/秒(Kilobytes/Second)

可用磁盘空间(aom_node_disk_available_capacity_megabytes)

还未经使用的磁盘空间。

≥0

兆字节(Megabytes)

磁盘空间容量(aom_node_disk_capacity_megabytes)

总的磁盘空间容量。

≥0

兆字节(Megabytes)

磁盘读写状态(aom_node_disk_rw_status)

该指标用于统计主机上磁盘的读写状态。

0、1

  • 0表示读写
  • 1表示只读

磁盘使用率(aom_node_disk_usage)

已使用的磁盘空间占总的磁盘空间容量百分比。

≥0

百分比(Percent)

CPU内核总量(aom_node_cpu_limit_core)

该指标用于统计测量对象申请的CPU核总量。

≥1

核(Core)

CPU内核占用(aom_node_cpu_used_core)

该指标用于统计测量对象已经使用的CPU核个数。

≥0

核(Core)

CPU使用率(aom_node_cpu_usage)

该指标用于统计测量对象的CPU使用率。

0~100%

百分比(Percent)

可用物理内存(aom_node_memory_free_megabytes)

该指标用于统计测量对象上的尚未被使用的物理内存。

≥0

兆字节(Megabytes)

可用虚拟内存(aom_node_virtual_memory_free_megabytes)

该指标用于统计测量对象上的尚未被使用的虚拟内存。

≥0

兆字节(Megabytes)

显存容量(aom_node_gpu_memory_free_megabytes)

该指标用于统计测量对象的显存容量。

>0

兆字节(Megabytes)

显存使用率(aom_node_gpu_memory_usage)

该指标用于统计测量对象已使用的显存占显存容量的百分比。

0~100%

百分比(Percent)

显存使用量(aom_node_gpu_memory_used_megabytes)

该指标用于统计测量对象已使用的显存。

≥0

兆字节(Megabytes)

GPU使用率(aom_node_gpu_usage)

该指标用于统计测量对象的GPU使用率。

0~100%

百分比(Percent)

NPU存储容量(aom_node_npu_memory_free_megabytes)

该指标用于统计测量对象的NPU存储容量。

>0

兆字节(Megabytes)

NPU存储使用率(aom_node_npu_memory_usage)

该指标用于统计测量对象已使用的NPU存储占NPU存储容量的百分比。

0~100%

百分比(Percent)

NPU存储使用量(aom_node_npu_memory_used_megabytes)

该指标用于统计测量对象已使用的NPU存储。

≥0

兆字节(Megabytes)

NPU使用率(aom_node_npu_usage)

该指标用于统计测量对象的NPU使用率。

0~100%

百分比(Percent)

NPU温度(aom_node_npu_temperature_centigrade)

该指标用于统计NPU的温度。

-

摄氏度(℃)

物理内存使用率(aom_node_memory_usage)

该指标用于统计测量对象已使用内存占申请物理内存总量的百分比。

0~100%

百分比(Percent)

主机状态(aom_node_status)

该指标用于统计主机状态是否正常。

  • 0表示正常
  • 非0表示异常

NTP偏移量(aom_node_ntp_offset_ms)

该指标用于统计主机本地时间与NTP服务器时间的偏移量,NTP偏移量越接近于0,主机本地时间与NTP服务器时间越接近。

毫秒(ms)

NTP服务器状态(aom_node_ntp_server_status)

该指标用于统计主机是否成功连接上NTP服务器。

  • 0、10表示已连接
  • 1表示未连接

NTP同步状态(aom_node_ntp_status)

该指标用于统计主机本地时间与NTP服务器时间是否同步。

  • 0、10表示同步
  • 1表示未同步

进程数量(aom_node_process_number)

该指标用于统计测量对象上的进程数量。

≥0

显卡温度(aom_node_gpu_temperature_centigrade)

该指标用于统计显卡的温度。

-

摄氏度(℃)

物理内存容量(aom_node_memory_total_megabytes)

该指标用于统计测量申请的物理内存总量。

≥0

兆字节(Megabytes)

虚拟内存容量(aom_node_virtual_memory_total_megabytes)

该指标用于统计测量对象上的虚拟内存总量。

≥0

兆字节(Megabytes)

虚拟内存使用率(aom_node_virtual_memory_usage)

该指标用于统计测量对象已使用虚拟内存占虚拟内存总量的百分比。

0~100%

百分比(Percent)

物理磁盘总容量(aom_node_phy_disk_total_capacity_megabytes)

该指标用于统计主机的磁盘总容量。

≥0

兆字节(Megabytes)

物理磁盘已使用总容量(aom_node_physical_disk_total_used_megabytes)

该指标用于统计主机已使用的磁盘总容量。

≥0

兆字节(Megabytes)

表2 容器指标

指标名称

指标含义

取值范围

单位

CPU内核总量(aom_container_cpu_limit_core)

该指标用于统计测量对象申请的CPU核总量。

≥1

核(Core)

CPU内核占用(aom_container_cpu_used_core)

该指标用于统计测量对象已经使用的CPU核个数。

≥0

核(Core)

CPU使用率(aom_container_cpu_usage)

该指标用于统计测量对象的CPU使用率。服务实际使用的与申请的CPU核数量比率。

0~100%

百分比(Percent)

磁盘读取速率(aom_container_disk_read_kilobytes)

该指标用于统计每秒从磁盘读出的数据量。

≥0

千字节/秒(Kilobytes/Second)

磁盘写入速率(aom_container_disk_write_kilobytes)

该指标用于统计每秒写入磁盘的数据量。

≥0

千字节/秒(Kilobytes/Second)

文件系统可用(aom_container_filesystem_available_capacity_megabytes)

该指标用于统计测量对象文件系统的可用大小。仅支持1.11及其更高版本的kubernetes集群中驱动模式为devicemapper的容器。

≥0

兆字节(Megabytes)

文件系统容量(aom_container_filesystem_capacity_megabytes)

该指标用于统计测量对象文件系统的容量。仅支持1.11及其更高版本的kubernetes集群中驱动模式为devicemapper的容器。

≥0

兆字节(Megabytes)

文件系统使用率(aom_container_filesystem_usage)

该指标用于统计测量对象文件系统使用率。实际使用量与文件系统容量的百分比。仅支持1.11及其更高版本的kubernetes集群中驱动模式为devicemapper的容器。

0~100%

百分比(Percent)

显存容量(aom_container_gpu_memory_free_megabytes)

该指标用于统计测量对象的显存容量。

>0

兆字节(Megabytes)

显存使用率(aom_container_gpu_memory_usage)

该指标用于统计测量对象已使用的显存占显存容量的百分比。

0~100%

百分比(Percent)

显存使用量(aom_container_gpu_memory_used_megabytes)

该指标用于统计测量对象已使用的显存。

≥0

兆字节(Megabytes)

GPU使用率(aom_container_gpu_usage)

该指标用于统计测量对象的GPU使用率。

0~100%

百分比(Percent)

NPU存储容量(aom_container_npu_memory_free_megabytes)

该指标用于统计测量对象的NPU存储容量。

>0

兆字节(Megabytes)

NPU存储使用率(aom_container_npu_memory_usage)

该指标用于统计测量对象已使用的NPU存储占NPU存储容量的百分比。

0~100%

百分比(Percent)

NPU存储使用量(aom_container_npu_memory_used_megabytes)

该指标用于统计测量对象已使用的NPU存储。

≥0

兆字节(Megabytes)

NPU使用率(aom_container_npu_usage)

该指标用于统计测量对象的NPU使用率。

0~100%

百分比(Percent)

物理内存总量(aom_container_memory_request_megabytes)

该指标用于统计测量对象申请的物理内存总量。

≥0

兆字节(Megabytes)

物理内存使用率(aom_container_memory_usage)

该指标用于统计测量对象已使用内存占申请物理内存总量的百分比。

0~100%

百分比(Percent)

物理内存使用量(aom_container_memory_used_megabytes)

该指标用于统计测量对象实际已经使用的物理内存(Resident Set Size)。

≥0

兆字节(Megabytes)

下行Bps(aom_container_network_receive_bytes)

该指标用于统计测试对象的入方向网络流速。

≥0

字节/秒(Bytes/Second)

下行Pps(aom_container_network_receive_packets)

每秒网卡接收的数据包个数。

≥0

个/秒(Packets/Second)

下行错包率(aom_container_network_receive_error_packets)

每秒网卡接收的错误包个数。

≥0

个/秒(Packets/Second)

容器错包个数(aom_container_network_rx_error_packets)

该指标用于统计测量对象收到错误包的数量。

≥0

个(Packets)

上行Bps(aom_container_network_transmit_bytes)

该指标用于统计测试对象的出方向网络流速。

≥0

字节/秒(Bytes/Second)

上行错包率

(aom_container_network_transmit_error_packets)

每秒网卡发送的错误包个数。

≥0

个/秒(Packets/Second)

上行Pps

(aom_container_network_transmit_packets)

每秒网卡发送的数据包个数。

≥0

个/秒(Packets/Second)

容器状态(aom_container_status)

该指标用于统计Docker容器状态是否正常。

  • 0、10表示正常
  • 1表示异常

表3 进程指标

指标名称

指标含义

取值范围

单位

CPU内核总量(aom_process_cpu_limit_core)

该指标用于统计测量对象申请的CPU核总量。

≥1

核(Core)

CPU内核占用(aom_process_cpu_used_core)

该指标用于统计测量对象已经使用的CPU核个数。

≥0

核(Core)

CPU使用率(aom_process_cpu_usage)

该指标用于统计测量对象的CPU使用率。服务实际使用的与申请的CPU核数量比率。

0~100%

百分比(Percent)

句柄数(aom_process_handle_count)

该指标用于统计测量对象使用的句柄数。

≥0

物理内存总量(aom_process_memory_request_megabytes)

该指标用于统计测量对象申请的物理内存总量。

≥0

兆字节(Megabytes)

物理内存使用率(aom_process_memory_usage)

该指标用于统计测量对象已使用内存占申请物理内存总量的百分比。

0~100%

百分比(Percent)

物理内存使用量(aom_process_memory_used_megabytes)

该指标用于统计测量对象实际已经使用的物理内存(Resident Set Size)。

≥0

兆字节(Megabytes)

进程状态(aom_process_status)

该指标用于统计进程状态是否正常。

  • 0、10表示正常
  • 1表示异常

线程数(aom_process_thread_count)

该指标用于统计测量对象使用的线程数。

≥0

虚拟内存总量(aom_process_virtual_memory_total_megabytes)

该指标用于统计测量对象申请的虚拟内存总量。

≥0

兆字节(Megabytes)

表4 集群指标

指标名称

指标含义

取值范围

单位

CPU内核总量(aom_cluster_cpu_limit_core)

该指标用于统计测量对象申请的CPU核总量。

≥1

核(Core)

CPU内核占用(aom_cluster_cpu_used_core)

该指标用于统计测量对象已经使用的CPU核数。

≥0

核(Core)

CPU使用率(aom_cluster_cpu_usage)

该指标用于统计测量对象的CPU使用率。

0~100%

百分比(Percent)

可用磁盘空间(aom_cluster_disk_available_capacity_megabytes)

还未经使用的磁盘空间。

≥0

兆字节(Megabytes)

磁盘空间容量(aom_cluster_disk_capacity_megabytes)

总的磁盘空间容量。

≥0

兆字节(Megabytes)

磁盘使用率(aom_cluster_disk_usage)

已使用的磁盘空间占总的磁盘空间容量百分比。

≥0

百分比(Percent)

可用物理内存(aom_cluster_memory_free_megabytes)

该指标用于统计测量对象上的尚未被使用的物理内存。

≥0

兆字节(Megabytes)

可用虚拟内存(aom_cluster_virtual_memory_free_megabytes)

该指标用于统计测量对象上的尚未被使用的虚拟内存。

≥0

兆字节(Megabytes)

显存容量(aom_cluster_gpu_memory_free_megabytes)

该指标用于统计测量对象的显存容量。

>0

兆字节(Megabytes)

显存使用率(aom_cluster_gpu_memory_usage)

该指标用于统计测量对象已使用的显存占显存容量的百分比。

0~100%

百分比(Percent)

显存使用量(aom_cluster_gpu_memory_used_megabytes)

该指标用于统计测量对象已使用的显存。

≥0

兆字节(Megabytes)

GPU使用率(aom_cluster_gpu_usage)

该指标用于统计测量对象的GPU使用率。

0~100%

百分比(Percent)

物理内存使用率(aom_cluster_memory_usage)

该指标用于统计测量对象已使用内存占申请物理内存总量的百分比。

0~100%

百分比(Percent)

下行Bps(aom_cluster_network_receive_bytes)

该指标用于统计测试对象的入方向网络流速。

≥0

字节/秒(Bytes/Second)

上行Bps(aom_cluster_network_transmit_bytes)

该指标用于统计测试对象的出方向网络流速。

≥0

字节/秒(Bytes/Second)

物理内存容量(aom_cluster_memory_total_megabytes)

该指标用于统计测量申请的物理内存总量。

≥0

兆字节(Megabytes)

虚拟内存容量(aom_cluster_virtual_memory_total_megabytes)

该指标用于统计测量对象上的虚拟内存总量。

≥0

兆字节(Megabytes)

虚拟内存使用率(aom_cluster_virtual_memory_usage)

该指标用于统计测量对象已使用虚拟内存占虚拟内存总量的百分比。

0~100%

百分比(Percent)

表5 APM指标

指标名称

指标含义

取值范围

单位

成功率(aom_sla_success_rate)

一个统计周期内所有接口调用的成功比例。

0~100%

百分比(%)

平均时延(aom_sla_tp99)

TP99时延=完成99%的网络请求所需要的最短耗时。

举例:假设总请求数为100个,它们的请求耗时分别为1s、2s、3s、4s……98s、99s、100s。若要完成99%的请求,至少需要99s,故TP99为99s。

计算:将所有请求按照耗时从小到大排序,第(99%*总请求数)个请求的耗时即为TP99时延。

≥0

毫秒(ms)

错误调用次数(aom_sla_error_count)

一个统计周期内所有接口调用的失败次数。

≥0

次(Count)

吞吐量(aom_sla_throughput)

指定时间内接口调用的总次数。

≥0

次/分(Transaction/Minute)

Apdex(aom_sla_apdex)

该指标表示应用性能满意度,数值越大表示满意度越高。

0~1

表6 其他指标

指标名称

指标含义

取值范围

单位

主机数量(aom_billing_hostUsed)

一天内接入的主机数量。

≥0

分享:

    相关文档

    相关产品

close