CPH支持的监控指标
本节定义了云手机服务器(CPH)上报云监控的监控指标的命名空间、监控指标列表和维度定义,用户可以通过云监控提供的管理控制台或API接口来检索云手机服务产生的监控指标和告警信息。
云监控服务最大支持4个层级维度,维度编号从0开始,编号3为最深层级。例如监控指标中的维度信息为“instance_id,cph_id”时,表示对应的监控指标的维度存在层级关系,且“instance_id”为0层,“cph_id”为1层。
命名空间
SYS.CPH
监控指标
云手机服务器(CPH)支持的监控指标包括:云手机服务器相关监控指标(表1)、云手机相关监控指标(表2)、磁盘相关监控指标(表3)和GPU卡相关监控指标(表4)。
|
指标ID |
指标名称 |
指标含义 |
取值范围 |
单位 |
进制 |
维度 |
监控周期(原始指标) |
|---|---|---|---|---|---|---|---|
|
cpu_usage |
CPU使用率 |
该指标用于统计测量对象当前CPU使用率。 |
0-100 |
% |
不涉及 |
instance_id |
1分钟 |
|
load_average5 |
5分钟平均负载 |
该指标用于统计测量对象过去5分钟的CPU平均负载。 |
≥0 |
不涉及 |
不涉及 |
instance_id |
1分钟 |
|
mem_usedPercent |
内存使用率 |
该指标用于统计测量对象的内存使用率。 |
0-100 |
% |
不涉及 |
instance_id |
1分钟 |
|
net_rx |
网络流入速率 |
该指标用于统计测量对象所有网卡接收字节的速率。 |
≥ 0 |
Byte/s |
1024(IEC) |
instance_id |
1分钟 |
|
net_tx |
网络流出速率 |
该指标用于统计测量对象所有网卡发送字节的速率。 |
≥ 0 |
Byte/s |
1024(IEC) |
instance_id |
1分钟 |
|
cph_sharebase_usedPercent |
共享存储空间使用率 |
该指标用于统计测量对象的共享存储空间使用率。 |
0-100 |
% |
不涉及 |
instance_id |
1分钟 |
|
cph_sharebase_available |
共享存储剩余可用量 |
该指标用于统计测量对象的共享存储剩余可用量。 |
- |
Byte |
1024(IEC) |
instance_id |
1分钟 |
|
指标ID |
指标名称 |
指标含义 |
取值范围 |
单位 |
进制 |
维度 |
监控周期(原始指标) |
|---|---|---|---|---|---|---|---|
|
cph_cpu_usage |
CPU使用率 |
该指标用于统计测量对象当前CPU使用率。 |
0-100 |
% |
不涉及 |
instance_id,cph_id |
1分钟 |
|
cph_mem_usedPercent |
内存使用率 |
该指标用于统计测量对象的内存使用率。 |
0-100 |
% |
不涉及 |
instance_id,cph_id |
1分钟 |
|
cph_mem_used |
内存使用量 |
该指标用于统计测量对象的内存使用量。 |
> 0 |
Byte |
1024(IEC) |
instance_id,cph_id |
1分钟 |
|
cph_net_rx |
网络流入速率 |
该指标用于统计测量对象网卡接收字节的速率。 |
≥ 0 |
Byte/s |
1024(IEC) |
instance_id,cph_id |
1分钟 |
|
cph_net_tx |
网络流出速率 |
该指标用于统计测量对象网卡发送字节的速率。 |
≥ 0 |
Byte/s |
1024(IEC) |
instance_id,cph_id |
1分钟 |
|
cph_disk_agt_read_bytes_rate |
云手机I/O读速率 |
该指标用于统计测量对象的读操作速率。 |
≥ 0 |
Byte/s |
1024(IEC) |
instance_id,cph_id |
1分钟 |
|
cph_disk_agt_write_bytes_rate |
云手机I/O写速率 |
该指标用于统计测量对象的写操作速率。 |
≥ 0 |
Byte/s |
1024(IEC) |
instance_id,cph_id |
1分钟 |
|
cph_disk_usedPercent |
云手机磁盘使用率 |
该指标用于统计测量对象的磁盘使用率。 |
0-100 |
% |
不涉及 |
instance_id,cph_id |
1分钟 |
|
cph_disk_percent |
云手机数据盘使用率 |
该指标用于统计测量对象的数据盘使用率。 |
0-100 |
% |
不涉及 |
instance_id,cph_id |
1分钟 |
|
cph_disk_inode_percent |
云手机数据盘inode使用率 |
该指标用于统计测量对象的数据盘inode使用率。 |
0-100 |
% |
不涉及 |
instance_id,cph_id |
1分钟 |
|
cph_sysdisk_percent |
云手机系统盘使用率 |
该指标用于统计测量对象的系统盘使用率。 |
0-100 |
% |
不涉及 |
instance_id,cph_id |
1分钟 |
|
cph_sysdisk_inode_percent |
云手机系统盘inode使用率 |
该指标用于统计测量对象的系统盘inode使用率。 |
0-100 |
% |
不涉及 |
instance_id,cph_id |
1分钟 |
|
cph_gpu_mem |
云手机GPU内存大小 |
该指标用于统计测量对象的总的GPU内存大小。 |
≥0 |
MB |
1024(IEC) |
instance_id,cph_id |
1分钟 |
|
指标ID |
指标名称 |
指标含义 |
取值范围 |
单位 |
进制 |
维度 |
监控周期(原始指标) |
|---|---|---|---|---|---|---|---|
|
disk_usage_read_request_rate |
磁盘读IOPS |
该指标用于统计每秒从测量对象读取数据的请求次数。 |
≥ 0 |
r/s |
不涉及 |
instance_id,disk_name |
1分钟 |
|
disk_usage_write_request_rate |
磁盘写IOPS |
该指标用于统计每秒到测量对象写入数据的请求次数。 |
≥ 0 |
w/s |
不涉及 |
instance_id,disk_name |
1分钟 |
|
disk_usage_read_rate |
磁盘读带宽 |
该指标用于统计每秒从测量对象读出的数据量。 |
≥ 0 |
KB/s |
不涉及 |
instance_id,disk_name |
1分钟 |
|
disk_usage_write_rate |
磁盘写带宽 |
该指标用于统计每秒写到测量对象的数据量。 |
≥ 0 |
KB/s |
不涉及 |
instance_id,disk_name |
1分钟 |
|
disk_usage_read_await |
平均读操作耗时 |
该指标用于统计测量对象在测量周期内平均每个读IO的操作时长。 |
≥ 0 |
ms |
不涉及 |
instance_id,disk_name |
1分钟 |
|
disk_usage_write_await |
平均写操作耗时 |
该指标用于统计测量对象在测量周期内平均每个写IO的操作时长。 |
≥ 0 |
ms |
不涉及 |
instance_id,disk_name |
1分钟 |
|
disk_usage_svctm |
平均IO服务时长 |
该指标用于统计测量对象在测量周期内平均每个读IO或写IO的服务时长。 |
≥ 0 |
ms |
不涉及 |
instance_id,disk_name |
1分钟 |
|
disk_usage_util |
磁盘读写使用率 |
该指标用于统计测量对象在测量周期内提交读取或写入操作的占比。 |
0-100 |
% |
不涉及 |
instance_id,disk_name |
1分钟 |
|
指标ID |
指标名称 |
指标含义 |
取值范围 |
单位 |
进制 |
维度 |
监控周期(原始指标) |
|---|---|---|---|---|---|---|---|
|
gpu_usage_gpu_load |
GPU使用率 |
该指标用于统计测量对象当前的GPU使用率。 |
0-100 |
% |
不涉及 |
instance_id,gpu_index |
1分钟 |
|
gpu_usage_vram |
GPU显存使用率(vram) |
该指标用于统计测量对象当前的GPU VRAM使用率。 |
0-100 |
% |
不涉及 |
instance_id,gpu_index |
1分钟 |
|
gpu_usage_gtt |
GPU显存使用率(gtt) |
该指标用于统计测量对象当前的GPU GTT使用率。 |
0-100 |
% |
不涉及 |
instance_id,gpu_index |
1分钟 |
|
gpu_usage_power |
GPU功率 |
该指标用于统计测量对象当前的GPU功率。 |
> 0 |
W |
不涉及 |
instance_id,gpu_index |
1分钟 |
|
gpu_usage_temperature |
GPU温度 |
该指标用于统计测量对象当前的GPU温度。 |
> 0 |
℃ |
不涉及 |
instance_id,gpu_index |
1分钟 |
|
gpu_usage_status |
GPU状态 |
该指标用于统计测量对象当前的GPU状态。 |
- |
不涉及 |
不涉及 |
instance_id,gpu_index |
1分钟 |
|
gpu_mem_busy_percent |
GPU显存负载 |
该指标用于统计测量对象当前的GPU显存负载。 |
0-100 |
% |
不涉及 |
instance_id,gpu_index |
1分钟 |
对于有多层测量维度的测量对象,使用接口查询监控指标时,需要代入具体指标的维度层级关系。
例如,需要查询云手机服务器中云手机实例当前的CPU使用率,该指标的维度信息为“instance_id,cph_id”,表示instance_id为0层,cph_id为1层。
- 通过API查询单个监控指标时,cph_id的维度信息代入样例如下:
dim.0=instance_id,1f40deafb8da456ab15d2fbcc70e43ee&dim.1=cph_id,7f0aa21f11864c04936ac61ba59f8c21
其中,1f40deafb8da456ab15d2fbcc70e43ee和7f0aa21f11864c04936ac61ba59f8c21分别为instance_id和cph_id的维度值,具体获取方法请参见“维度”表格中的获取指导。
- 通过API批量查询监控指标时,cph_id的维度信息代入样例如下:
"dimensions": [ { "name": "instance_id", "value": "1f40deafb8da456ab15d2fbcc70e43ee" }, { "name": "cph_id", "value": "7f0aa21f11864c04936ac61ba59f8c21" } ]其中,1f40deafb8da456ab15d2fbcc70e43ee和7f0aa21f11864c04936ac61ba59f8c21分别为instance_id和cph_id的维度值,具体获取方法请参见“维度”表格中的获取指导。
维度
|
Key |
Value |
|---|---|
|
instance_id |
云手机服务器ID。 该取值可通过“查询云手机服务器列表”获取。 |
|
cph_id |
云手机ID。 该取值可通过“查询云手机列表”获取。 |
|
disk_name |
磁盘名称。 |
|
gpu_index |
GPU名称。 |