创建告警规则并查看
通过告警规则可对资源的指标设置阈值条件,当指标数据满足阈值条件时,会产生告警。当没有指标数据上报时,会产生数据不足事件,以便您在第一时间发现异常并进行处理。
按照配置方式的不同,创建指标告警规则可分为三种:按资源类型创建、按全量指标创建和按Prometheus命令创建。本章以按资源类型创建为例介绍如何添加告警规则并查看告警。
创建指标告警规则
- 在菜单栏选择“监控中心”,进入“监控中心”界面。
- 在左侧导航栏中选择“告警管理 > 告警规则”。
- 在“规则列表”页签下单击 “创建告警规则”。
- 设置告警规则基本信息,具体的参数说明如表1所示。
- 设置告警规则的详细信息。
- 选择“规则类型”为“指标告警规则”。
- 选择指标配置方式为“按资源类型”,设置资源类型和监控对象信息。
- 设置告警条件。告警条件可通过自定义创建和从模板导入两种方式设置,此处选择自定义创建方式:
- 自定义创建
单击“自定义创建”,设置连续周期、统计周期、阈值条件等告警条件参数。具体的参数说明如表2所示。
表2 告警条件填写说明 参数类别
参数名称
参数说明
告警条件
指标
需要监控的指标。
连续周期
连续多少个周期满足阈值条件后,发送指标告警。
统计周期
指标数据按照所设置的统计周期进行聚合,包括:1分钟、5分钟、15分钟、1小时。
统计方式
指标数据按照所设置的统计方式进行聚合,包括:平均值、最小值、最大值、总计、样本个数。
阈值条件
指标告警的触发条件,由判断条件(>=、<=、>、<)和阈值组成。例如,阈值条件设置为“>85”,表示指标的实际值大于已设置的阈值85时,生成指标告警。
告警级别
指标告警的级别,包括:紧急、重要、次要、提示。
-
检查频率
根据设置的频率对指标数据查询和分析结果进行检查。
高级设置
告警恢复
监控周期内监控对象不满足触发条件时,则恢复告警。默认只监控一个周期,最多可监控5个周期指标数据。
无数据处理
监控周期内无指标数据产生或指标数据不足时系统的处理方式,根据业务需要开启或者关闭。
默认只监控一个周期,最多可监控5个周期指标数据。
系统处理方式包括:超限阈值并发送告警、数据不足并发送事件、保持上一个状态、正常并发送清除告警。
- 自定义创建
- 设置告警通知策略。直接告警方式:满足告警条件,直接发送告警。
- 单击“立即创建”,完成创建。创建完成后,单击“返回告警规则列表”可查看已创建的告警规则。
在展开的列表中,只要某个指标数据满足设置的告警条件时,在告警界面就会生成一条指标类告警,您可在左侧导航栏中选择“告警管理 > 告警列表”,在告警列表中查看该告警。
查看告警
- 在左侧导航栏中选择“告警管理 > 告警列表”。
- 单击“告警”页签,查看告警信息。
- 您可参考表3执行如下操作: