更新时间:2024-09-29 GMT+08:00
分享

支持的监控指标

本节定义了云手机服务器(CPH)上报云监控的监控指标的命名空间、监控指标列表和维度定义,用户可以通过云监控提供的管理控制台API接口来检索云手机服务产生的监控指标和告警信息。

命名空间

SYS.CPH

监控指标

云手机服务器(CPH)支持的监控指标包括:云手机服务器相关监控指标(表1)、云手机相关监控指标(表2)、磁盘相关监控指标(表3)和GPU卡相关监控指标(表4)。

表1 云手机服务器支持的监控指标

指标ID

指标名称

指标含义

取值范围

测量对象

监控周期(原始指标)

cpu_usage

CPU使用率

该指标用于统计测量对象当前CPU使用率。

0-100%

云手机服务器

1分钟

load_average5

5分钟平均负载

该指标用于统计测量对象过去5分钟的CPU平均负载。

≥0

云手机服务器

1分钟

mem_usedPercent

内存使用率

该指标用于统计测量对象的内存使用率。

0-100%

云手机服务器

1分钟

net_rx

网络流入速率

该指标用于统计测量对象所有网卡接收字节的速率。

≥ 0 byte/s

云手机服务器

1分钟

net_tx

网络流出速率

该指标用于统计测量对象所有网卡发送字节的速率。

≥ 0 byte/s

云手机服务器

1分钟

cph_sharebase_usedPercent

共享存储空间使用率

该指标用于统计测量对象的共享存储空间使用率。

0-100%

云手机服务器

1分钟

表2 云手机支持的监控指标

指标ID

指标名称

指标含义

取值范围

测量对象

监控周期(原始指标)

cph_cpu_usage

CPU使用率

该指标用于统计测量对象当前CPU使用率。

0-100%

云手机

1分钟

cph_mem_usedPercent

内存使用率

该指标用于统计测量对象的内存使用率。

0-100%

云手机

1分钟

cph_mem_used

内存使用量

该指标用于统计测量对象的内存使用量。

> 0 byte

云手机

1分钟

cph_net_rx

网络流入速率

该指标用于统计测量对象网卡接收字节的速率。

≥ 0 byte/s

云手机

1分钟

cph_net_tx

网络流出速率

该指标用于统计测量对象网卡发送字节的速率。

≥ 0 byte/s

云手机

1分钟

cph_disk_agt_read_bytes_rate

云手机I/O读速率

该指标用于统计测量对象的读操作速率。

≥ 0 byte/s

云手机

1分钟

cph_disk_agt_write_bytes_rate

云手机I/O写速率

该指标用于统计测量对象的写操作速率。

≥ 0 byte/s

云手机

1分钟

cph_disk_usedPercent

云手机磁盘使用率

该指标用于统计测量对象的磁盘使用率。

0-100%

云手机

1分钟

cph_disk_percent

云手机数据盘使用率

该指标用于统计测量对象的数据盘使用率。

0-100%

云手机

1分钟

cph_disk_inode_percent

云手机数据盘inode使用率

该指标用于统计测量对象的数据盘inode使用率。

0-100%

云手机

1分钟

cph_sysdisk_percent

云手机系统盘使用率

该指标用于统计测量对象的系统盘使用率。

0-100%

云手机

1分钟

cph_sysdisk_inode_percent

云手机系统盘inode使用率

该指标用于统计测量对象的系统盘inode使用率。

0-100%

云手机

1分钟

cph_gpu_mem

云手机GPU内存大小

该指标用于统计测量对象的总的GPU内存大小(MB)。

≥0MB

云手机

1分钟

表3 磁盘支持的监控指标

指标ID

指标名称

指标含义

取值范围

测量对象

监控周期(原始指标)

disk_usage_read_request_rate

磁盘读IOPS

该指标用于统计每秒从测量对象读取数据的请求次数。

≥ 0 请求/秒

磁盘

1分钟

disk_usage_write_request_rate

磁盘写IOPS

该指标用于统计每秒到测量对象写入数据的请求次数。

≥ 0 请求/秒

磁盘

1分钟

disk_usage_read_rate

磁盘读带宽

该指标用于统计每秒从测量对象读出的数据量。

≥ 0 KB/s

磁盘

1分钟

disk_usage_write_rate

磁盘写带宽

该指标用于统计每秒写到测量对象的数据量。

≥ 0 KB/s

磁盘

1分钟

disk_usage_read_await

平均读操作耗时

该指标用于统计测量对象在测量周期内平均每个读IO的操作时长。

≥ 0 ms/操作

磁盘

1分钟

disk_usage_write_await

平均写操作耗时

该指标用于统计测量对象在测量周期内平均每个写IO的操作时长。

≥ 0 ms/操作

磁盘

1分钟

disk_usage_svctm

平均IO服务时长

该指标用于统计测量对象在测量周期内平均每个读IO或写IO的服务时长。

≥ 0 ms

磁盘

1分钟

disk_usage_util

磁盘读写使用率

该指标用于统计测量对象在测量周期内提交读取或写入操作的占比。

0-100%

磁盘

1分钟

表4 GPU卡支持的监控指标

指标ID

指标名称

指标含义

取值范围

测量对象

监控周期(原始指标)

gpu_usage_gpu_load

GPU使用率

该指标用于统计测量对象当前的GPU使用率。

0-100%

云手机服务器

1分钟

gpu_usage_vram

GPU显存使用率(vram)

该指标用于统计测量对象当前的GPU VRAM使用率。

0-100%

云手机服务器

1分钟

gpu_usage_gtt

GPU显存使用率(gtt)

该指标用于统计测量对象当前的GPU GTT使用率。

0-100%

云手机服务器

1分钟

gpu_usage_power

GPU功率

该指标用于统计测量对象当前的GPU功率。

> 0 W

云手机服务器

1分钟

gpu_usage_temperature

GPU温度

该指标用于统计测量对象当前的GPU温度。

> 0 ℃

云手机服务器

1分钟

gpu_usage_status

GPU状态

该指标用于统计测量对象当前的GPU状态。

-

云手机服务器

1分钟

gpu_mem_busy_percent

GPU显存负载

该指标用于统计测量对象当前的GPU显存负载。

0-100%

GPU

1分钟

维度

Key

Value

instance_id

云手机服务器ID

cph_id

云手机ID

disk_name

磁盘名称

gpu_index

GPU名称

相关文档