分组规则
AOM的告警降噪提供了告警路由分组功能。使用分组规则,您可以从告警中筛选出满足条件的告警子集,然后按分组条件对告警子集分组,告警触发时同组告警会被汇聚在一起发送一条通知。
如图1所示,当路由条件设置为clusterName:clusteraom时,表示系统会先根据路由条件从告警中过滤出满足clusterName为clusteraom的告警子集,然后根据分组条件对告警子集分组,分组后的告警内容再根据首次等待、变化等待、重复等待等条件进行合并,合并后的告警可以关联行动策略,触发告警通知。
创建分组规则
- 在左侧导航栏中选择“告警 > 告警降噪”,在展开的右侧分栏中选择“分组规则”。
- 单击 “创建分组规则”,设置规则名称、继承规则、路由条件等信息,字段说明请参见表1。图2 创建分组规则
表1 分组规则字段说明 字段名称
字段描述
示例
规则名称
请输入规则名称,名称只能以大小写字母、数字、下划线组成,且不能以下划线开头和结尾,最多不能超过100个字符。
ruleName
继承规则
分组规则支持多重继承,即选择继承某一条通知规则的路由条件和分组条件。
“AOM内置根路由分组规则”为根规则,不设任何路由和分组条件,如若不想继承任何规则,可在创建时选择此根规则。
AOM内置根路由分组规则
路由条件
根据选定的方式对告警过滤,筛选出符合路由条件的告警。
若路由条件设置为event_severity:Critical ,则符合event_severity为Critical的告警会被筛选出来,根据分组条件分组。
event_severity:Critical,event_type:alarm
分组条件
根据指定字段对告警分组 。同组告警会被汇聚在一起发送一条通知。分组条件可为系统已有告警字段和自定义上报告警字段。
event_severity,event_type
描述
分组规则的描述。
-
首次等待
创建或修改分组规则后,生效的时间。取值范围是0s-10min,推荐设置为 15s。
变化等待
将等待周期内产生的告警进行合并的时间。变化等待时间不得低于首次等待时间。取值范围是5s-30min,推荐设置为60s。
若变化等待时间为1分钟,则可理解为一分钟处理一批次的告警和事件。
重复等待
告警成功发送后,等待再次发送的时间。
取值范围是1min-15day,推荐设置为1h。
若重复等待时间设为1h,1h内此告警和事件未被清除,则再次发送通知。
行动策略
行动策略即关联消息发送SMN和自定义模板功能,详情请参见告警行动策略。
-
- 设置完成后,单击“确定”,完成分组规则创建。
更多分组规则操作
分组规则创建完成后,您还可以执行表2中的相关操作。
