通过CES监控ELB业务状况并设置告警
应用场景
用户在使用ELB的过程中有了解业务负载详情的需求,为使用户更好地掌握ELB的流量负载情况,华为云提供了立体化监控平台云监控服务(CES)。通过云监控服务用户可以执行自动实时监控、告警和通知操作,帮助用户实时掌握通过ELB负载的运行情况。
在自动实时监控的基础上,您可以在云监控服务中设置告警规则,规定在某些特殊情况出现时向您发送告警通知。
您可以参考本实践设置基础业务场景的监控指标,监控阈值可以动态调整,但是不建议高于推荐指标的阈值。
操作流程

创建监控告警规则和通知
当监控指标触发设定的阈值或者事件发生时,云监控服务会在第一时间通过消息通知服务实时告知您云上资源异常,以免因此造成业务损失。
- 登录管理控制台。
- 在管理控制台左上角选择区域和项目。
- 单击“服务列表 > 云监控服务”。
- 选择“告警 > 告警规则”。
- 单击“创建告警规则”。
- 在“创建告警规则”界面,根据界面提示配置参数。
- 根据界面提示,配置告警规则的基本信息
表1 配置规则信息 参数
参数说明
取值样例
名称
系统会随机产生一个名称,用户也可以进行修改。
alarm-elb
描述
告警规则描述(此参数非必填项)。
-
- 选择监控对象,配置告警内容参数。
表2 配置告警内容 参数
参数说明
取值样例
告警类型
告警规则适用的告警类型。
指标
云产品
当告警类型选择指标时,需配置告警规则监控的服务名称。
弹性负载均衡支持的监控指标,请参见云产品监控指标。
弹性负载均衡-弹性负载均衡
资源层级
当告警类型选择指标时,需选择告警规则的资源层级,可选择云产品或子维度,推荐选择云产品。
在弹性负载均衡服务中,指标划分了多个子维度(包含弹性负载均衡、监听器、后端主机组、可用区等)。
云产品
监控范围
当告警类型选择指标时,需选择告警规则适用的资源范围,可选择全部资源、资源分组或指定资源。
说明:
- 选择“全部资源”时,则当前云产品下任何资源满足告警策略时,都会触发告警。可单击“选择排除资源”排除不需要监控的资源。
- 选择“资源分组”时,该分组下任何资源满足告警策略时,都会触发告警。可单击“选择排除资源”排除不需要监控的资源。
- 选择“指定资源”时,在“监控对象”单击“选择指定资源”进行指定资源的选择。
全部资源
触发规则
- 自定义创建:自定义创建告警策略,当监控指标满足告警策略则发送告警。
- 关联模板:选择关联模板后,所关联模板内容修改后,该告警规则中所包含策略也会跟随修改。
自定义创建
告警策略
当监控指标在一定周期内多次触发告警策略的阈值时,系统将向用户发送告警通知。
监控指标详情配置请参见基础场景推荐监控指标(独享型)或基础场景推荐监控指标(共享型)。
说明:
告警规则内最多可添加50条告警策略,若其中一条告警策略达到条件都会触发告警。
-
告警级别
根据告警的严重程度不同等级,可选择紧急、重要、次要、提示。
-
- 根据界面提示,配置告警通知参数。
图2 配置告警通知
表3 配置告警通知 参数
参数说明
发送通知
配置是否发送短信、邮件、语音通知、HTTP、HTTPS、FunctionGraph(函数)、FunctionGraph(工作流)、企业微信、钉钉、飞书或Welink通知用户。
通知方式
根据需要可选择通知策略、通知组或主题订阅的方式。
- 通知策略支持告警分级别灵活通知,更全量通知渠道等更多功能。
- 通知组的通知内容模板在云监控服务配置。
- 主题订阅的通知内容模板需要在消息通知服务配置。
通知策略
当通知方式选择通知策略时,需要选择告警通知的策略。通知策略是包含通知组选择、生效时间、通知内容模板等参数的组合编排。
通知组
当通知方式选择通知组时,需要选择发送告警通知的通知组。创建通知组请参见创建通知对象/通知组。
通知对象
当通知方式选择主题订阅时,需要发送告警通知的对象,可选择云账号联系人或主题名称。
通知内容模板
当通知方式选择通知组或主题订阅时,可选择已有模板或创建通知内容模板。
生效时间
当通知方式选择通知组或主题订阅时,需要设置生效时间。
该告警仅在生效时间段发送通知消息,非生效时段则在隔日生效时段发送通知消息。
如生效时间为08:00-20:00,则该告警规则仅在08:00-20:00发送通知消息。
触发条件
当通知方式选择通知组或主题订阅时,需要设置触发条件。
可以选择“出现告警”、“恢复正常”两种状态,作为触发告警通知的条件。
- 根据界面提示,配置归属企业项目和标签。
表4 配置规则信息 参数
参数说明
归属企业项目
告警规则所属的企业项目。只有拥有该企业项目权限的用户才可以查看和管理该告警规则。
标签
标签由键值对组成,用于标识云资源,可对云资源进行分类和搜索。
- 键的长度最大128字符,值的长度最大225字符。
- 最多可创建20个标签。
- 配置完成后,单击“立即创建”,完成告警规则的创建。
- 根据界面提示,配置告警规则的基本信息
告警规则添加完成后,当监控指标触发设定的阈值时,云监控服务会在第一时间通过消息通知服务实时告知您云上资源异常,以免因此造成业务损失。
您可通过配置关键使用率指标告警快速识别业务流量是否超限。
告警处理建议:及时通过变更ELB实例规格和增加实例可用区进行扩容。
监控指标 |
告警策略 |
||||||
---|---|---|---|---|---|---|---|
指标ID |
指标名称 |
监控对象 |
指标值类型 |
连续触发次数 |
比较关系 |
阈值 |
告警周期 |
l4_ncps_usage |
4层新建连接数使用率 |
|
原始值 |
3 |
> |
紧急:80% |
1小时 |
l4_con_usage |
4层并发连接数使用率 |
|
原始值 |
3 |
> |
紧急:80% |
1小时 |
l4_in_bps_usage |
4层入带宽使用率 |
|
原始值 |
3 |
> |
重要:80% |
1小时 |
l4_out_bps_usage |
4层出带宽使用率 |
|
原始值 |
3 |
> |
重要:80% |
1小时 |
l7_ncps_usage |
7层新建连接数使用率 |
|
原始值 |
3 |
> |
紧急:80% |
1小时 |
l7_con_usage |
7层并发连接数使用率 |
|
原始值 |
3 |
> |
紧急:80% |
1小时 |
l7_qps_usage |
7层查询速率使用率 |
|
原始值 |
3 |
> |
紧急:80% |
1小时 |
l7_in_bps_usage |
7层入带宽使用率 |
|
原始值 |
3 |
> |
重要:80% |
1小时 |
l7_out_bps_usage |
7层出带宽使用率 |
|
原始值 |
3 |
> |
重要:80% |
1小时 |
您可通过配置指标7层协议返回码等告警快速识别7层业务请求是否被正确处理。
告警处理建议:通过访问日志排查业务情况。
监控指标 |
告警策略 |
||||||
---|---|---|---|---|---|---|---|
指标ID |
指标名称 |
测量对象 |
指标值类型 |
连续触发次数 |
比较关系 |
阈值 |
告警周期 |
mb_l7_qps |
7层查询速率 |
弹性负载均衡-监听器 |
原始值 |
1 |
环比波动 |
重要:20% |
1小时 |
mc_l7_http_2xx |
7层协议返回码(2XX) |
弹性负载均衡-监听器 |
原始值 |
1 |
环比波动 |
重要:20% |
1小时 |
me_l7_http_4xx |
7层协议返回码(4XX) |
弹性负载均衡-监听器 |
原始值 |
1 |
环比波动 |
重要:20% |
1小时 |
mf_l7_http_5xx |
7层协议返回码(5XX) |
弹性负载均衡-监听器 |
原始值 |
1 |
环比波动 |
重要:20% |
1小时 |
m14_l7_rt |
7层协议RT平均值 |
弹性负载均衡-监听器 |
原始值 |
1 |
环比波动 |
重要:20% |
1小时 |
m15_l7_upstream_4xx |
7层后端返回码(4XX) |
弹性负载均衡-监听器 |
原始值 |
1 |
环比波动 |
重要:20% |
1小时 |
m16_l7_upstream_5xx |
7层后端返回码(5XX) |
弹性负载均衡-监听器 |
原始值 |
1 |
环比波动 |
重要:20% |
1小时 |
您可通过配置指标异常主机数告警及时获取后端服务器的健康状况。
告警处理建议:请及时排查后端服务器异常原因。
监控指标 |
告警策略 |
||||||
---|---|---|---|---|---|---|---|
指标ID |
指标名称 |
测量对象 |
指标值类型 |
连续触发次数 |
比较关系 |
阈值 |
告警周期 |
m9_abnormal_servers |
异常主机数 |
|
原始值 |
1 |
> |
紧急:0 |
1小时 |
您可通过配置关键使用率指标告警快速识别业务流量是否超限。
告警处理建议:及时通过变更ELB实例规格和增加实例可用区进行扩容。
监控指标 |
告警策略 |
||||||
---|---|---|---|---|---|---|---|
指标ID |
指标名称 |
监控对象 |
指标值类型 |
连续触发次数 |
比较关系 |
阈值 |
告警周期 |
l4_ncps_usage |
4层新建连接数使用率 |
|
原始值 |
3 |
> |
紧急:80% |
1小时 |
l4_con_usage |
4层并发连接数使用率 |
|
原始值 |
3 |
> |
紧急:80% |
1小时 |
l4_in_bps_usage |
4层入带宽使用率 |
|
原始值 |
3 |
> |
重要:80% |
1小时 |
l4_out_bps_usage |
4层出带宽使用率 |
|
原始值 |
3 |
> |
重要:80% |
1小时 |
l7_ncps_usage |
7层新建连接数使用率 |
|
原始值 |
3 |
> |
紧急:80% |
1小时 |
l7_con_usage |
7层并发连接数使用率 |
|
原始值 |
3 |
> |
紧急:80% |
1小时 |
l7_qps_usage |
7层查询速率使用率 |
|
原始值 |
3 |
> |
紧急:80% |
1小时 |
l7_in_bps_usage |
7层入带宽使用率 |
|
原始值 |
3 |
> |
重要:80% |
1小时 |
l7_out_bps_usage |
7层出带宽使用率 |
|
原始值 |
3 |
> |
重要:80% |
1小时 |
您可通过配置指标7层协议返回码等告警快速识别7层业务请求是否被正确处理。
告警处理建议:通过访问日志排查业务情况。
监控指标 |
告警策略 |
||||||
---|---|---|---|---|---|---|---|
指标ID |
指标名称 |
测量对象 |
指标值类型 |
连续触发次数 |
比较关系 |
阈值 |
告警周期 |
mb_l7_qps |
7层查询速率 |
弹性负载均衡-监听器 |
原始值 |
1 |
环比波动 |
重要:20% |
1小时 |
mc_l7_http_2xx |
7层协议返回码(2XX) |
弹性负载均衡-监听器 |
原始值 |
1 |
环比波动 |
重要:20% |
1小时 |
me_l7_http_4xx |
7层协议返回码(4XX) |
弹性负载均衡-监听器 |
原始值 |
1 |
环比波动 |
重要:20% |
1小时 |
mf_l7_http_5xx |
7层协议返回码(5XX) |
弹性负载均衡-监听器 |
原始值 |
1 |
环比波动 |
重要:20% |
1小时 |
m14_l7_rt |
7层协议RT平均值 |
弹性负载均衡-监听器 |
原始值 |
1 |
环比波动 |
重要:20% |
1小时 |
m15_l7_upstream_4xx |
7层后端返回码(4XX) |
弹性负载均衡-监听器 |
原始值 |
1 |
环比波动 |
重要:20% |
1小时 |
m16_l7_upstream_5xx |
7层后端返回码(5XX) |
弹性负载均衡-监听器 |
原始值 |
1 |
环比波动 |
重要:20% |
1小时 |
您可通过配置指标异常主机数告警及时获取后端服务器的健康状况。
告警处理建议:请及时排查后端服务器异常原因。
监控指标 |
告警策略 |
||||||
---|---|---|---|---|---|---|---|
指标ID |
指标名称 |
测量对象 |
指标值类型 |
连续触发次数 |
比较关系 |
阈值 |
告警周期 |
m9_abnormal_servers |
异常主机数 |
|
原始值 |
1 |
> |
紧急:0 |
1小时 |
您可通过配置关键使用率指标告警快速识别业务流量是否超限。
告警处理建议:建议升级为独享型ELB实例实现扩容。
监控指标 |
告警策略 |
||||||
---|---|---|---|---|---|---|---|
指标ID |
指标名称 |
测量对象 |
指标值类型 |
连续触发次数 |
比较关系 |
阈值 |
告警周期 |
m1_cps |
并发连接数 |
弹性负载均衡 |
原始值 |
3 |
> |
紧急:40000 |
1小时 |
m4_ncps |
新建连接数 |
弹性负载均衡 |
原始值 |
3 |
> |
紧急:40000 |
1小时 |
您可通过配置指标7层协议返回码告警快速识别7层业务请求是否被正确处理。
告警处理建议:通过访问日志排查业务情况。
监控指标 |
告警策略 |
||||||
---|---|---|---|---|---|---|---|
指标ID |
指标名称 |
测量对象 |
指标值类型 |
连续触发次数 |
比较关系 |
阈值 |
告警周期 |
mb_l7_qps |
7层查询速率 |
弹性负载均衡-监听器 |
原始值 |
1 |
环比波动 |
重要:20% |
1小时 |
m14_l7_rt |
7层协议RT平均值 |
弹性负载均衡-监听器 |
原始值 |
1 |
环比波动 |
重要:20% |
1小时 |
mc_l7_http_2xx |
7层协议返回码(2XX) |
弹性负载均衡-监听器 |
原始值 |
1 |
环比波动 |
重要:20% |
1小时 |
me_l7_http_4xx |
7层协议返回码(4XX) |
弹性负载均衡-监听器 |
原始值 |
1 |
环比波动 |
重要:20% |
1小时 |
mf_l7_http_5xx |
7层协议返回码(5XX) |
弹性负载均衡-监听器 |
原始值 |
1 |
环比波动 |
重要:20% |
1小时 |
m15_l7_upstream_4xx |
7层后端返回码(4XX) |
弹性负载均衡-监听器 |
原始值 |
1 |
环比波动 |
重要:20% |
1小时 |
m16_l7_upstream_5xx |
7层后端返回码(5XX) |
弹性负载均衡-监听器 |
原始值 |
1 |
环比波动 |
重要:20% |
1小时 |
您可通过配置指标异常主机数告警及时获取后端服务器的健康状况。
告警处理建议:请及时排查后端服务器异常原因。
监控指标 |
告警策略 |
||||||
---|---|---|---|---|---|---|---|
指标ID |
指标名称 |
测量对象 |
指标值类型 |
连续触发次数 |
比较关系 |
阈值 |
告警周期 |
m9_abnormal_servers |
异常主机数 |
弹性负载均衡 |
原始值 |
1 |
> |
紧急:0 |
1小时 |
您可通过配置关键使用率指标告警快速识别业务流量是否超限。
告警处理建议:建议升级为独享型ELB实例实现扩容。
监控指标 |
告警策略 |
||||||
---|---|---|---|---|---|---|---|
指标ID |
指标名称 |
测量对象 |
指标值类型 |
连续触发次数 |
比较关系 |
阈值 |
告警周期 |
m1_cps |
并发连接数 |
弹性负载均衡 |
原始值 |
3 |
> |
紧急:40000 |
1小时 |
m4_ncps |
新建连接数 |
弹性负载均衡 |
原始值 |
3 |
> |
紧急:40000 |
1小时 |
您可通过配置指标7层协议返回码告警快速识别7层业务请求是否被正确处理。
告警处理建议:通过访问日志排查业务情况。
监控指标 |
告警策略 |
||||||
---|---|---|---|---|---|---|---|
指标ID |
指标名称 |
测量对象 |
指标值类型 |
连续触发次数 |
比较关系 |
阈值 |
告警周期 |
mb_l7_qps |
7层查询速率 |
弹性负载均衡-监听器 |
原始值 |
1 |
环比波动 |
重要:20% |
1小时 |
m14_l7_rt |
7层协议RT平均值 |
弹性负载均衡-监听器 |
原始值 |
1 |
环比波动 |
重要:20% |
1小时 |
mc_l7_http_2xx |
7层协议返回码(2XX) |
弹性负载均衡-监听器 |
原始值 |
1 |
环比波动 |
重要:20% |
1小时 |
me_l7_http_4xx |
7层协议返回码(4XX) |
弹性负载均衡-监听器 |
原始值 |
1 |
环比波动 |
重要:20% |
1小时 |
mf_l7_http_5xx |
7层协议返回码(5XX) |
弹性负载均衡-监听器 |
原始值 |
1 |
环比波动 |
重要:20% |
1小时 |
m15_l7_upstream_4xx |
7层后端返回码(4XX) |
弹性负载均衡-监听器 |
原始值 |
1 |
环比波动 |
重要:20% |
1小时 |
m16_l7_upstream_5xx |
7层后端返回码(5XX) |
弹性负载均衡-监听器 |
原始值 |
1 |
环比波动 |
重要:20% |
1小时 |
您可通过配置指标异常主机数告警及时获取后端服务器的健康状况。
告警处理建议:请及时排查后端服务器异常原因。
监控指标 |
告警策略 |
||||||
---|---|---|---|---|---|---|---|
指标ID |
指标名称 |
测量对象 |
指标值类型 |
连续触发次数 |
比较关系 |
阈值 |
告警周期 |
m9_abnormal_servers |
异常主机数 |
弹性负载均衡 |
原始值 |
1 |
> |
紧急:0 |
1小时 |