支持的监控指标
本节定义了云手机服务器(CPH)上报云监控的监控指标的命名空间、监控指标列表和维度定义,用户可以通过云监控提供的管理控制台或API接口来检索云手机服务产生的监控指标和告警信息。
命名空间
SYS.CPH
监控指标
云手机服务器(CPH)支持的监控指标包括:云手机服务器相关监控指标(表1)、云手机相关监控指标(表2)、磁盘相关监控指标(表3)和GPU卡相关监控指标(表4)。
指标ID |
指标名称 |
指标含义 |
取值范围 |
测量对象 |
监控周期(原始指标) |
---|---|---|---|---|---|
cpu_usage |
CPU使用率 |
该指标用于统计测量对象当前CPU使用率。 |
0-100% |
云手机服务器 |
1分钟 |
load_average5 |
5分钟平均负载 |
该指标用于统计测量对象过去5分钟的CPU平均负载。 |
≥0 |
云手机服务器 |
1分钟 |
mem_usedPercent |
内存使用率 |
该指标用于统计测量对象的内存使用率。 |
0-100% |
云手机服务器 |
1分钟 |
net_rx |
网络流入速率 |
该指标用于统计测量对象所有网卡接收字节的速率。 |
≥ 0 byte/s |
云手机服务器 |
1分钟 |
net_tx |
网络流出速率 |
该指标用于统计测量对象所有网卡发送字节的速率。 |
≥ 0 byte/s |
云手机服务器 |
1分钟 |
cph_sharebase_usedPercent |
共享存储空间使用率 |
该指标用于统计测量对象的共享存储空间使用率。 |
0-100% |
云手机服务器 |
1分钟 |
指标ID |
指标名称 |
指标含义 |
取值范围 |
测量对象 |
监控周期(原始指标) |
---|---|---|---|---|---|
cph_cpu_usage |
CPU使用率 |
该指标用于统计测量对象当前CPU使用率。 |
0-100% |
云手机 |
1分钟 |
cph_mem_usedPercent |
内存使用率 |
该指标用于统计测量对象的内存使用率。 |
0-100% |
云手机 |
1分钟 |
cph_mem_used |
内存使用量 |
该指标用于统计测量对象的内存使用量。 |
> 0 byte |
云手机 |
1分钟 |
cph_net_rx |
网络流入速率 |
该指标用于统计测量对象网卡接收字节的速率。 |
≥ 0 byte/s |
云手机 |
1分钟 |
cph_net_tx |
网络流出速率 |
该指标用于统计测量对象网卡发送字节的速率。 |
≥ 0 byte/s |
云手机 |
1分钟 |
cph_disk_agt_read_bytes_rate |
云手机I/O读速率 |
该指标用于统计测量对象的读操作速率。 |
≥ 0 byte/s |
云手机 |
1分钟 |
cph_disk_agt_write_bytes_rate |
云手机I/O写速率 |
该指标用于统计测量对象的写操作速率。 |
≥ 0 byte/s |
云手机 |
1分钟 |
cph_disk_usedPercent |
云手机磁盘使用率 |
该指标用于统计测量对象的磁盘使用率。 |
0-100% |
云手机 |
1分钟 |
cph_disk_percent |
云手机数据盘使用率 |
该指标用于统计测量对象的数据盘使用率。 |
0-100% |
云手机 |
1分钟 |
cph_disk_inode_percent |
云手机数据盘inode使用率 |
该指标用于统计测量对象的数据盘inode使用率。 |
0-100% |
云手机 |
1分钟 |
cph_sysdisk_percent |
云手机系统盘使用率 |
该指标用于统计测量对象的系统盘使用率。 |
0-100% |
云手机 |
1分钟 |
cph_sysdisk_inode_percent |
云手机系统盘inode使用率 |
该指标用于统计测量对象的系统盘inode使用率。 |
0-100% |
云手机 |
1分钟 |
cph_gpu_mem |
云手机GPU内存大小 |
该指标用于统计测量对象的总的GPU内存大小(MB)。 |
≥0MB |
云手机 |
1分钟 |
指标ID |
指标名称 |
指标含义 |
取值范围 |
测量对象 |
监控周期(原始指标) |
---|---|---|---|---|---|
disk_usage_read_request_rate |
磁盘读IOPS |
该指标用于统计每秒从测量对象读取数据的请求次数。 |
≥ 0 请求/秒 |
磁盘 |
1分钟 |
disk_usage_write_request_rate |
磁盘写IOPS |
该指标用于统计每秒到测量对象写入数据的请求次数。 |
≥ 0 请求/秒 |
磁盘 |
1分钟 |
disk_usage_read_rate |
磁盘读带宽 |
该指标用于统计每秒从测量对象读出的数据量。 |
≥ 0 KB/s |
磁盘 |
1分钟 |
disk_usage_write_rate |
磁盘写带宽 |
该指标用于统计每秒写到测量对象的数据量。 |
≥ 0 KB/s |
磁盘 |
1分钟 |
disk_usage_read_await |
平均读操作耗时 |
该指标用于统计测量对象在测量周期内平均每个读IO的操作时长。 |
≥ 0 ms/操作 |
磁盘 |
1分钟 |
disk_usage_write_await |
平均写操作耗时 |
该指标用于统计测量对象在测量周期内平均每个写IO的操作时长。 |
≥ 0 ms/操作 |
磁盘 |
1分钟 |
disk_usage_svctm |
平均IO服务时长 |
该指标用于统计测量对象在测量周期内平均每个读IO或写IO的服务时长。 |
≥ 0 ms |
磁盘 |
1分钟 |
disk_usage_util |
磁盘读写使用率 |
该指标用于统计测量对象在测量周期内提交读取或写入操作的占比。 |
0-100% |
磁盘 |
1分钟 |
指标ID |
指标名称 |
指标含义 |
取值范围 |
测量对象 |
监控周期(原始指标) |
---|---|---|---|---|---|
gpu_usage_gpu_load |
GPU使用率 |
该指标用于统计测量对象当前的GPU使用率。 |
0-100% |
云手机服务器 |
1分钟 |
gpu_usage_vram |
GPU显存使用率(vram) |
该指标用于统计测量对象当前的GPU VRAM使用率。 |
0-100% |
云手机服务器 |
1分钟 |
gpu_usage_gtt |
GPU显存使用率(gtt) |
该指标用于统计测量对象当前的GPU GTT使用率。 |
0-100% |
云手机服务器 |
1分钟 |
gpu_usage_power |
GPU功率 |
该指标用于统计测量对象当前的GPU功率。 |
> 0 W |
云手机服务器 |
1分钟 |
gpu_usage_temperature |
GPU温度 |
该指标用于统计测量对象当前的GPU温度。 |
> 0 ℃ |
云手机服务器 |
1分钟 |
gpu_usage_status |
GPU状态 |
该指标用于统计测量对象当前的GPU状态。 |
- |
云手机服务器 |
1分钟 |
gpu_mem_busy_percent |
GPU显存负载 |
该指标用于统计测量对象当前的GPU显存负载。 |
0-100% |
GPU |
1分钟 |
维度
Key |
Value |
---|---|
instance_id |
云手机服务器ID |
cph_id |
云手机ID |
disk_name |
磁盘名称 |
gpu_index |
GPU名称 |