创建告警规则和通知
当您需要监控各云服务资源的使用情况或云服务资源的关键操作时,可以创建告警规则。告警规则添加完成后,当监控指标触发设定的阈值或者指定的事件发生时,云监控服务会在第一时间通过消息通知服务实时告知您云上资源异常,以免因此造成业务损失。
本章节介绍如何创建告警规则。
前提条件
创建告警规则
- 登录云监控服务管理控制台。
- 选择“告警 > 告警规则”。
- 单击“创建告警规则”。
- 在“创建告警规则”界面,根据界面提示配置参数。
- 根据界面提示,配置告警规则的基本信息。
图1 基本信息
- 选择监控对象,配置告警内容参数。
图2 配置告警内容
表2 配置告警内容 参数
参数说明
取值样例
告警类型
告警规则适用的告警类型,可选择指标、事件告警类型。如何选择告警类型请参见表1。
指标
云产品
当告警类型选择指标时,需配置告警规则监控的服务名称。
支持的云产品以及云产品对应的监控指标说明,请参见云产品监控指标。
弹性云服务器-云服务器
资源层级
监控对象的资源层级。当告警类型选择指标时,需选择告警规则的资源层级,可选择云产品或子维度。推荐选择云产品。
以弹性云服务器ECS为例:用户购买了云产品(ECS虚拟机),根据指标划分了多个子维度(包含磁盘、挂载点、进程等)。
说明:当资源层级选择云产品时,单条告警规则支持跨子维度指标(如磁盘使用率、CPU使用率),当资源层级选择子维度时,单条告警规则不支持跨子维度指标。
云产品
监控范围
告警规则适用的资源范围。
- 选择“全部资源”时,则当前云产品下任何资源满足告警策略时,都会触发告警。可单击“选择排除资源”排除不需要监控的资源。
- 选择“资源分组”时,该分组下任何资源满足告警策略时,都会触发告警。可单击“选择排除资源”排除不需要监控的资源。
- 选择“指定资源”时,在“监控对象”单击“选择指定资源”进行指定资源的选择。
说明:- 当告警类型选择指标时,监控范围可选择全部资源、资源分组或指定资源。
- 当告警类型选择事件且事件类型为系统事件时,支持配置监控范围。目前只有DDS、RDS、DCS3个服务的事件类告警的监控范围支持选择资源分组。
指定资源
分组
当监控范围选择资源分组时,需要选择分组。若当前已有的资源分组不满足使用条件时,可以单击“创建资源分组”进行创建。
在分组下拉框中选择资源分组名称后,可单击“查看组内资源详情”查看选择分组内的资源信息。告警规则配置完成后,不支持修改分组。
-
监控对象
当监控范围选择指定资源时,需要选择告警规则的监控对象。
单击“选择指定资源”,在页面右侧的资源列表中选择需要监控的资源。
-
条件类型
针对弹性云服务器,您可以选择静态阈值和动态阈值。当前仅在华南-广州上线。
- 静态阈值:指告警触发规则设置成固定的阈值,如果指标达到设置的阈值,则触发告警。
- 动态阈值:指告警触发阈值是根据智能计算指标的历史数据预测指标的阈值,若实际值偏离预测值,则触发告警。
静态阈值
事件类型
当告警类型选择事件时,需要选择事件类型,可选择系统事件或自定义事件。各云服务支持的事件请参考事件监控支持的事件说明。
系统事件
事件来源
当告警类型选择事件时,需要设置事件来源。
- 当事件类型选择系统事件时,在下拉列表中选择事件来源的云服务名称。
- 当事件类型选择自定义事件,事件来源需要与上报的字段一致,格式需要为service.item形式,如何上报事件请参见上报事件。
弹性云服务器
触发规则
选择配置告警策略的方式,当配置指标类告警规则或系统事件类告警规则时,支持选择关联模板和自定义创建两种方式,当配置自定义事件类告警规则时,只支持自定义创建。
- 自定义创建:用户根据需要自定义配置告警策略。
- 关联模板:当同一个云产品下多组资源需要配置相同的告警规则时,使用告警模板可省去手动重复配置的过程。
自定义创建
模板
当触发规则为关联模板时,需要选择导入的模板。
您可以选择系统预置的默认告警模板,或者选择自定义模板。
说明:一个告警模板可能包含多个云产品或同一个云产品不同维度的告警策略,在创建告警规则时,根据资源层级的不同会有所差异:
- 资源层级选择云产品,则告警模板中该云产品所有的告警策略都会同步到告警规则的策略中,其他云产品的策略不会同步到告警规则的策略中。
- 资源层级选择子维度,则告警模板中与当前资源相同维度的告警策略才会添加到告警规则的策略中。
-
告警策略
当触发规则选择“自定义创建”时,需要设置触发告警规则的告警策略。
- 当“告警类型”选择“指标”时,是否触发告警取决于连续周期的数据是否达到阈值。例如CPU使用率监控周期为5分钟,连续三个周期平均值≥80%,则触发告警。
- 当告警类型为事件时,触发告警具体的事件为一个瞬间的事件。例如重启虚拟机,则触发告警。
更多告警策略参数介绍请参见告警策略。
单条告警规则内最多可添加50条告警策略,您可以选择满足任意策略则发送告警,也可以选择满足所有策略则发送告警。
-
告警级别
根据告警的严重程度不同等级,可选择紧急、重要、次要、提示。
重要
- 根据界面提示,配置告警通知参数。
图3 配置告警通知
表3 配置告警通知 参数
参数说明
取值样例
发送通知
通过开关按钮配置是否发告警通知,支持通过短信、邮件、HTTP、HTTPS、FunctionGraph(函数)、FunctionGraph(工作流)、企业微信、钉钉、飞书或Welink等方式通知用户。默认开启。
开启
通知方式
发送告警通知的通知方式,根据需要可选择通知组或主题订阅的方式。
- 选择通知组时,需要先创建通知对象,并将通知对象添加到通知组中。
- 主题订阅的通知对象可以选择云账号联系人,也可以选择通过在消息通知服务中自定义创建的主题。
说明:CES的告警通知依赖SMN服务,如果SMN服务内部处理延迟时间比较大,可能会导致用户收到的告警有延迟。
通知组
通知组
当通知方式选择通知组时,需要选择发送告警通知的通知组。创建通知组请参见创建通知对象/通知组。
-
通知对象
当通知方式选择主题订阅时,需要选择发送告警通知的对象,可选择云账号联系人或主题。若主题的显示名有值,则展示格式为:主题名称(显示名),并且支持通过主题名或显示名进行搜索。若主题未设置显示名则只展示主题名称。
云账号联系人
生效时间
当通知方式选择通知组或主题订阅时,需要设置生效时间。
该告警仅在生效时间段发送通知消息,非生效时段则在隔日生效时段发送通知消息。
如生效时间为08:00-20:00,当监控指标触发设定的阈值或者指定的事件发生时仅在08:00-20:00发送通知消息。
08:00-20:00
时区
告警生效时间的时区,默认为客户端浏览器所在时区,支持配置。
(GMT+08:00) 北京,重庆,香港特别行政区,乌鲁木齐,吉隆坡,新加坡,珀斯,台北,伊尔库茨克,乌兰巴托
触发条件
当通知方式选择通知组或主题订阅时,需要设置触发条件。
- 当告警类型为指标时,可以选择“出现告警”、“恢复正常”两种状态,作为触发告警通知的条件。
- 当告警类型为事件时,只支持选择“出现告警”作为触发告警通知的条件。
出现告警
- 根据界面提示,进行高级配置。
图4 高级配置
- 配置完成后,单击“立即创建”,完成告警规则的创建。
告警规则添加完成后,当监控指标触发设定的阈值时,云监控服务会在第一时间通过消息通知服务实时告知您云上资源异常,以免因此造成业务损失。