CPH支持的监控指标
本节定义了云手机服务器(CPH)上报云监控的监控指标的命名空间、监控指标列表和维度定义,用户可以通过云监控提供的管理控制台或API接口来检索云手机服务产生的监控指标和告警信息。

云监控服务最大支持4个层级维度,维度编号从0开始,编号3为最深层级。例如监控指标中的维度信息为“instance_id,cph_id”时,表示对应的监控指标的维度存在层级关系,且“instance_id”为0层,“cph_id”为1层。
命名空间
SYS.CPH
监控指标
云手机服务器(CPH)支持的监控指标包括:云手机服务器相关监控指标(表1)、云手机相关监控指标(表2)、磁盘相关监控指标(表3)和GPU卡相关监控指标(表4)。
指标ID | 指标名称 | 指标含义 | 取值范围 | 单位 | 进制 | 维度 | 监控周期(原始指标) |
|---|---|---|---|---|---|---|---|
cpu_usage | CPU使用率 | 该指标用于统计测量对象当前CPU使用率。 | 0-100 | % | 不涉及 | instance_id | 1分钟 |
load_average5 | 5分钟平均负载 | 该指标用于统计测量对象过去5分钟的CPU平均负载。 | ≥0 | 不涉及 | 不涉及 | instance_id | 1分钟 |
mem_usedPercent | 内存使用率 | 该指标用于统计测量对象的内存使用率。 | 0-100 | % | 不涉及 | instance_id | 1分钟 |
net_rx | 网络流入速率 | 该指标用于统计测量对象所有网卡接收字节的速率。 | ≥ 0 | Byte/s | 1024(IEC) | instance_id | 1分钟 |
net_tx | 网络流出速率 | 该指标用于统计测量对象所有网卡发送字节的速率。 | ≥ 0 | Byte/s | 1024(IEC) | instance_id | 1分钟 |
cph_sharebase_usedPercent | 共享存储空间使用率 | 该指标用于统计测量对象的共享存储空间使用率。 | 0-100 | % | 不涉及 | instance_id | 1分钟 |
cph_sharebase_available | 共享存储剩余可用量 | 该指标用于统计测量对象的共享存储剩余可用量。 | - | Byte | 1024(IEC) | instance_id | 1分钟 |
指标ID | 指标名称 | 指标含义 | 取值范围 | 单位 | 进制 | 维度 | 监控周期(原始指标) |
|---|---|---|---|---|---|---|---|
cph_cpu_usage | CPU使用率 | 该指标用于统计测量对象当前CPU使用率。 | 0-100 | % | 不涉及 | instance_id,cph_id | 1分钟 |
cph_mem_usedPercent | 内存使用率 | 该指标用于统计测量对象的内存使用率。 | 0-100 | % | 不涉及 | instance_id,cph_id | 1分钟 |
cph_mem_used | 内存使用量 | 该指标用于统计测量对象的内存使用量。 | > 0 | Byte | 1024(IEC) | instance_id,cph_id | 1分钟 |
cph_net_rx | 网络流入速率 | 该指标用于统计测量对象网卡接收字节的速率。 | ≥ 0 | Byte/s | 1024(IEC) | instance_id,cph_id | 1分钟 |
cph_net_tx | 网络流出速率 | 该指标用于统计测量对象网卡发送字节的速率。 | ≥ 0 | Byte/s | 1024(IEC) | instance_id,cph_id | 1分钟 |
cph_disk_agt_read_bytes_rate | 云手机I/O读速率 | 该指标用于统计测量对象的读操作速率。 | ≥ 0 | Byte/s | 1024(IEC) | instance_id,cph_id | 1分钟 |
cph_disk_agt_write_bytes_rate | 云手机I/O写速率 | 该指标用于统计测量对象的写操作速率。 | ≥ 0 | Byte/s | 1024(IEC) | instance_id,cph_id | 1分钟 |
cph_disk_percent | 云手机数据盘使用率 | 该指标用于统计测量对象的数据盘使用率。 | 0-100 | % | 不涉及 | instance_id,cph_id | 1分钟 |
cph_disk_inode_percent | 云手机数据盘inode使用率 | 该指标用于统计测量对象的数据盘inode使用率。 | 0-100 | % | 不涉及 | instance_id,cph_id | 1分钟 |
cph_sysdisk_percent | 云手机系统盘使用率 | 该指标用于统计测量对象的系统盘使用率。 | 0-100 | % | 不涉及 | instance_id,cph_id | 1分钟 |
cph_sysdisk_inode_percent | 云手机系统盘inode使用率 | 该指标用于统计测量对象的系统盘inode使用率。 | 0-100 | % | 不涉及 | instance_id,cph_id | 1分钟 |
cph_gpu_mem | 云手机GPU内存大小 | 该指标用于统计测量对象的总的GPU内存大小。 | ≥0 | MB | 1024(IEC) | instance_id,cph_id | 1分钟 |
指标ID | 指标名称 | 指标含义 | 取值范围 | 单位 | 进制 | 维度 | 监控周期(原始指标) |
|---|---|---|---|---|---|---|---|
disk_usage_read_request_rate | 磁盘读IOPS | 该指标用于统计每秒从测量对象读取数据的请求次数。 | ≥ 0 | r/s | 不涉及 | instance_id,disk_name | 1分钟 |
disk_usage_write_request_rate | 磁盘写IOPS | 该指标用于统计每秒到测量对象写入数据的请求次数。 | ≥ 0 | w/s | 不涉及 | instance_id,disk_name | 1分钟 |
disk_usage_read_rate | 磁盘读带宽 | 该指标用于统计每秒从测量对象读出的数据量。 | ≥ 0 | KB/s | 不涉及 | instance_id,disk_name | 1分钟 |
disk_usage_write_rate | 磁盘写带宽 | 该指标用于统计每秒写到测量对象的数据量。 | ≥ 0 | KB/s | 不涉及 | instance_id,disk_name | 1分钟 |
disk_usage_read_await | 平均读操作耗时 | 该指标用于统计测量对象在测量周期内平均每个读IO的操作时长。 | ≥ 0 | ms | 不涉及 | instance_id,disk_name | 1分钟 |
disk_usage_write_await | 平均写操作耗时 | 该指标用于统计测量对象在测量周期内平均每个写IO的操作时长。 | ≥ 0 | ms | 不涉及 | instance_id,disk_name | 1分钟 |
disk_usage_util | 磁盘读写使用率 | 该指标用于统计测量对象在测量周期内提交读取或写入操作的占比。 | 0-100 | % | 不涉及 | instance_id,disk_name | 1分钟 |
指标ID | 指标名称 | 指标含义 | 取值范围 | 单位 | 进制 | 维度 | 监控周期(原始指标) |
|---|---|---|---|---|---|---|---|
gpu_usage_gpu_load | GPU使用率 | 该指标用于统计测量对象当前的GPU使用率。 | 0-100 | % | 不涉及 | instance_id,gpu_index | 1分钟 |
gpu_usage_vram | GPU显存使用率(vram) | 该指标用于统计测量对象当前的GPU VRAM使用率。 | 0-100 | % | 不涉及 | instance_id,gpu_index | 1分钟 |
gpu_usage_gtt | GPU显存使用率(gtt) | 该指标用于统计测量对象当前的GPU GTT使用率。 | 0-100 | % | 不涉及 | instance_id,gpu_index | 1分钟 |
gpu_usage_power | GPU功率 | 该指标用于统计测量对象当前的GPU功率。 | > 0 | W | 不涉及 | instance_id,gpu_index | 1分钟 |
gpu_usage_temperature | GPU温度 | 该指标用于统计测量对象当前的GPU温度。 | > 0 | ℃ | 不涉及 | instance_id,gpu_index | 1分钟 |
gpu_usage_status | GPU状态 | 该指标用于统计测量对象当前的GPU状态。 | - | 不涉及 | 不涉及 | instance_id,gpu_index | 1分钟 |
gpu_mem_busy_percent | GPU显存负载 | 该指标用于统计测量对象当前的GPU显存负载。 | 0-100 | % | 不涉及 | instance_id,gpu_index | 1分钟 |
对于有多层测量维度的测量对象,使用接口查询监控指标时,需要代入具体指标的维度层级关系。
例如,需要查询云手机服务器中云手机实例当前的CPU使用率,该指标的维度信息为“instance_id,cph_id”,表示instance_id为0层,cph_id为1层。
- 通过API查询单个监控指标时,cph_id的维度信息代入样例如下:
dim.0=instance_id,1f40deafb8da456ab15d2fbcc70e43ee&dim.1=cph_id,7f0aa21f11864c04936ac61ba59f8c21
其中,1f40deafb8da456ab15d2fbcc70e43ee和7f0aa21f11864c04936ac61ba59f8c21分别为instance_id和cph_id的维度值,具体获取方法请参见“维度”表格中的获取指导。
- 通过API批量查询监控指标时,cph_id的维度信息代入样例如下:
"dimensions": [ { "name": "instance_id", "value": "1f40deafb8da456ab15d2fbcc70e43ee" }, { "name": "cph_id", "value": "7f0aa21f11864c04936ac61ba59f8c21" } ]其中,1f40deafb8da456ab15d2fbcc70e43ee和7f0aa21f11864c04936ac61ba59f8c21分别为instance_id和cph_id的维度值,具体获取方法请参见“维度”表格中的获取指导。
维度
Key | Value |
|---|---|
instance_id | 云手机服务器ID。 该取值可通过“查询云手机服务器列表”获取。 |
cph_id | 云手机ID。 该取值可通过“查询云手机列表”获取。 |
disk_name | 磁盘名称。 |
gpu_index | GPU名称。 |

