监控指标说明
功能说明
本节定义了弹性伸缩上报云监控的监控指标的命名空间,监控指标列表,各项监控指标的具体含义与使用说明,用户可以通过云监控检索弹性伸缩服务产生的监控指标和告警信息。
命名空间
SYS.AS
配置指标类告警策略
用户可以针对弹性伸缩的核心监控指标设置指标告警,在发生异常时及时通知您采取措施。您可以根据以下指引配置告警类告警策略。
基本概念
参数 | 参数说明 | 取值样例 |
|---|---|---|
指标名称 | 弹性伸缩监控指标的名称。 | CPU使用率 |
指标值类型 | 监控的指标值类型。分为最大值、最小值、平均值、原始值、方差值和求和值6种。
| 原始值 |
比较关系 | 比较检测指标值和阈值的关系。 比较关系分为>、>=、<、<=。 | > |
阈值 | 设置监控指标达到的临界值。 | 70 |
弹性伸缩支持的监控指标
弹性伸缩支持的监控指标如表1所示。
指标ID | 指标名称 | 指标含义 | 取值范围 | 单位 | 进制 | 测量对象(维度) | 监控周期(原始指标) |
|---|---|---|---|---|---|---|---|
cpu_util | CPU使用率 | 该指标用于统计弹性伸缩组的CPU使用率。 计算公式:伸缩组中的所有云服务器的CPU使用率之和/伸缩组实例数 | ≥0 | % | 不涉及 | instance_id | 5分钟 |
mem_util | 内存使用率 | 该指标用于统计弹性伸缩组的内存使用率,以百分比为单位。 计算公式:伸缩组中的所有云服务器内存使用率之和/伸缩组实例数 说明: 如果用户使用的镜像未安装vmtools,则无法获取该监控指标。 | ≥0 | % | 不涉及 | instance_id | 5分钟 |
instance_num | 实例数 | 该指标用于统计弹性伸缩组中可用的云服务器云主机数量。 计算公式:弹性伸缩组内生命周期状态为“已启用”的云服务器数量之和 | ≥0 | count | 不涉及 | instance_id | 5分钟 |
network_incoming_bytes_rate_inband | 带内网络流入速率 | 该指标用于统计每秒流入弹性伸缩组的网络流量。 计算公式:伸缩组中所有云服务器的带内网络流入速率之和 / 伸缩组实例数 | ≥0 | byte/s | 1024(IEC) | instance_id | 5分钟 |
network_outgoing_bytes_rate_inband | 带内网络流出速率 | 该指标用于统计每秒流出弹性伸缩组的网络流量。 计算公式:伸缩组中所有云服务器的带内网络流出速率之和 / 伸缩组实例数 | ≥0 | byte/s | 1024(IEC) | instance_id | 5分钟 |
disk_read_bytes_rate | 磁盘读速率 | 该指标用于统计每秒从弹性伸缩组读出的数据量。 计算公式:伸缩组中所有云服务器的磁盘读速率之和 / 伸缩组实例数 | ≥0 | byte/s | 1024(IEC) | instance_id | 5分钟 |
disk_write_bytes_rate | 磁盘写速率 | 该指标用于统计每秒写到弹性伸缩组的数据量。 计算公式:伸缩组中所有云服务器的磁盘写速率之和 / 伸缩组实例数 | ≥0 | byte/s | 1024(IEC) | instance_id | 5分钟 |
disk_read_requests_rate | 磁盘读操作速率 | 该指标用于统计每秒从弹性伸缩组读取数据的请求次数。 计算公式:伸缩组中所有云服务器的磁盘读操作速率之和 / 伸缩组实例数 | ≥0 | r/s | 不涉及 | instance_id | 5分钟 |
disk_write_requests_rate | 磁盘写操作速率 | 该指标用于统计每秒往弹性伸缩组写数据的请求次数。 计算公式:伸缩组中的所有云服务器的磁盘写操作速率之和 / 伸缩组实例数 | ≥0 | r/s | 不涉及 | instance_id | 5分钟 |
cpu_usage | (Agent)CPU使用率 | 该指标用于统计弹性伸缩组的(Agent)CPU使用率。 计算公式:伸缩组中的所有云服务器的(Agent)CPU使用率之和/伸缩组实例数 | 0-100 | % | 不涉及 | instance_id | 1分钟 |
mem_usedPercent | (Agent)内存使用率 | 该指标用于统计弹性伸缩组的(Agent)内存使用率,以百分比为单位。 计算公式:伸缩组中的所有云服务器(Agent)内存使用率之和/伸缩组实例数 | 0-100 | % | 不涉及 | instance_id | 1分钟 |
load_average1 | (Agent)1分钟平均负载 | 该指标用于统计测量对象中所有云服务器过去1分钟的CPU平均负载的均值。 | ≥0 | - | 不涉及 | instance_id | 1分钟 |
load_average5 | (Agent)5分钟平均负载 | 该指标用于统计测量对象中所有云服务器过去5分钟的CPU平均负载的均值。 | ≥0 | - | 不涉及 | instance_id | 1分钟 |
load_average15 | (Agent)15分钟平均负载 | 该指标用于统计测量对象中所有云服务器过去15分钟的CPU平均负载的均值。 | ≥0 | - | 不涉及 | instance_id | 1分钟 |
gpu_usage_gpu | (Agent)GPU使用率 | 该指标用于统计弹性伸缩组的(Agent)GPU使用率,以百分比为单位。 计算公式:伸缩组中的所有云服务器(Agent)GPU使用率之和/伸缩组实例数 | 0-100 | % | 不涉及 | instance_id | 1分钟 |
gpu_usage_mem | (Agent)显存使用率 | 该指标用于统计弹性伸缩组的(Agent)显存使用率,以百分比为单位。 计算公式:伸缩组中的所有云服务器(Agent)显存使用率之和/伸缩组实例数 | 0-100 | % | 不涉及 | instance_id | 1分钟 |

区分带Agent和不带Agent的监控指标:有的操作系统需要安装Agent后才能获取到相应的监控指标,此时,触发条件应选择带有Agent字样的监控指标(如:(Agent)内存使用率)。

对于不同的操作系统,监控指标“内存使用率”、“带内网络流出速率”和“带内网络流入速率”是否支持,详细信息请参见《弹性云服务器用户指南》。
如需使用Agent监控指标,请确认伸缩组中的实例已安装Agent插件,详细信息请参见“如何为伸缩组中的实例安装Agent插件?”。
维度
Key | Value |
|---|---|
instance_id | 弹性伸缩组的ID。 该取值可通过“查询弹性伸缩组中的实例列表”获取。 |

