查看告警
告警是指AOM自身或外部服务在异常情况、可能导致异常情况下上报的信息,并且您需采取相应措施清除故障,否则会由于AOM自身或外部服务的功能异常而引起业务的异常。“告警列表”页面提供告警查询和处理功能,便于您更快地发现、定位并恢复故障。
功能介绍
在告警列表中,有以下关键功能:
- 告警列表:支持按告警级别图形化查看告警信息。
- 高级过滤:支持在搜索框中按告警级别 、告警源、告警关键字等条件进行过滤,默认按照告警级别过滤。
- 告警清除:支持单个、批量清除告警。
- 告警详情:在告警详情中查看告警对象的信息和修复建议,所有的告警都提供修复建议。
操作步骤
- 登录AOM 2.0控制台。
- 在左侧导航栏中选择“告警管理 > 告警列表”。
- 单击“告警”页签,查看告警信息。
- 设置时间范围,查看已设时间范围内产生的告警。可通过如下两种方式设置时间范围:
方式一:使用AOM预定义好的时间标签,例如,近1小时、近6小时等,您可根据实际需要选择不同的时间粒度。
方式二:通过开始时间和结束时间,自定义时间范围,您最长可设置为31天。
- 设置告警信息的刷新频率。单击,根据需要从下拉列表中选择,例如,手动刷新、1分钟等。
- 设置搜索条件后,单击,查看在已设时间范围内满足搜索条件的告警。支持在搜索框中按告警级别 、告警源、告警关键字等条件进行过滤,默认按照告警级别过滤。
表1 搜索条件说明 搜索条件
搜索条件说明
设置样例
告警级别
支持选择如下告警级别进行搜索:- 紧急
- 重要
- 次要
- 提示
告警级别:重要,即可查询出指定时间范围内告警级别为“重要”的告警。
资源类型
支持选择资源类型别进行搜索。
资源类型:Host,即可查询出指定时间范围内资源类型为“Host”的告警。
告警源
支持选择告警源进行搜索。
告警源:AOM,即可查询出指定时间范围内告警源为“AOM”的告警。
告警关键字
支持按告警名称 、 告警源、资源类型等告警关键字进行模糊查询。
搜索框的筛选条件设置为“告警关键字”,然后输入关键字信息。
告警关键字:AOMRule,其中AOMRule为告警名称,即可查询出指定时间范围内告警名称为“AOMRule”的告警。
自定义属性
支持根据告警信息中的自定义属性进行精确查询。
搜索框的筛选条件设置为“自定义属性”,然后输入自定义属性信息“自定义属性名称=自定义属性值”。
自定义属性:nodeIP=192.168.0.106,即可查询出指定时间范围内自定义属性主机IP(nodeIP)为192.168.0.106的相关告警。
- 设置时间范围,查看已设时间范围内产生的告警。可通过如下两种方式设置时间范围:
- 您可参考表2执行如下操作:
表2 操作说明 操作
说明
查看告警统计数据
单击,可通过柱状图查看在指定时间范围内和搜索条件下告警的统计数据。
清除告警
- 清除一个告警:单击目标告警所在“操作”列中的“”。
- 清除一个或多个告警:选中一个或多个告警前的复选框,在弹出框单击“批量清除”。
说明:
告警故障已经解除时可进行清除操作。
查看告警详情
单击告警名称可查看告警详情,包括告警信息和修复建议,如果在创建告警规则时关联了告警行动规则或告警降噪规则,还可查看行动规则或告警降噪规则相关信息。
说明:- 在“告警信息”页签下单击告警规则、日志组、日志流等蓝色字体可下钻到具体详情页面,查看更详细的数据。
- 在华东-上海一区域查看告警时支持以下功能:
- 告警源为LTS的告警:单击告警详情页中日志组、日志流、关键词、查询语句可跳转到具体详情页面,查看更详细的数据。
- 关联CCE类型Prometheus实例的告警规则触发的告警:单击告警详情页中涉及容器相关资源的cluster_name、node、pod、container时,可以跳转至AOM的系统内置仪表盘中查询相应时间的指标曲线。
- 规则类型为应用性能监控的告警规则触发的告警:单击告警详情页的应用、组件、环境,可跳转至组件指标项详情页。
查看已清除告警
在右上角单击“活动告警”,在下拉列表中选择“历史告警”,可查看被清除的告警。