处理告警
当汇聚告警生成后,用户可以通过云运维中心快速处理,执行响应方案,支持作业、脚本两种方式。
注意事项
只有责任人可以处理当前告警。
前提条件
已开通“故障管理”套餐,具体计费情况请参考计费说明。
处理告警
只有责任人可以处理当前告警。
- 登录云运维中心。
- 在左侧导航栏选择“故障管理 > 告警管理”。
- 单击“汇聚告警 > 当前告警”。
- 选择需要处理的告警,单击操作列“更多 > 处理”。
- 设置“任务类型”。
- 单击“确定”。
完成告警处理。
告警转事件
当汇聚告警生成后,用户可以通过云运维中心将指定汇聚告警转为事件。转为事件后会生成相应的事件单,在关联事件单号列显示生成的实际单号。
注意:只有责任人可以将当前告警转为事件。
- 登录云运维中心。
- 在左侧导航栏选择“故障管理 > 告警管理”。
- 单击“汇聚告警 > 当前告警”。
- 选择需要处理的告警,单击“转事件”。
- 设置“告警转事件”。
表1 告警转事件参数说明 参数
说明
企业项目
在下拉列表中选择企业项目。
故障发生时间
请填写故障发生的时间。
故障应用
在下拉列表选择故障应用。
事件级别
可选项“P1”、“P2”、“P3”、“P4”、“P5”。
严重程度默认“P1”最严重,“P5”最轻微。
业务是否中断
可选项“是”、“否”。
事件类别
在下拉列表选择事件的类别。
事件名称
根据命名规则,自定义事件的名称。
事件描述
对事件进行描述。
- 单击“确定”。
完成告警转事件。
清除告警
当汇聚告警生成后,会显示在当前告警页签。若告警已经处理完毕或由于其他原因需要清除,可以通过清除告警功能将汇聚告警从当前告警页签清除,清除后的汇聚告警可以在历史告警页签中查看。
注意事项:
- 只有责任人可以将当前告警进行清除。
- 告警数据留存期为31天,逾期将自动清除,包含历史告警页签的数据。
- 登录云运维中心。
- 在左侧导航栏选择“故障管理 > 告警管理”。
- 单击“汇聚告警 > 当前告警”。
- 选择需要清除的告警,单击操作列“清除”。
- 设置“清除告警”。
表2 清除告警参数说明 参数
说明
业务是否中断
可选项“是”、“否”。
故障发生时间
仅业务是否中断选择“是”时需要设置。
请填写故障发生的时间。
故障恢复时间
仅业务是否中断选择“是”时需要设置。
请填写故障的恢复时间。
备注
可选参数。请填写备注。
备注支持中文字符、英文字母、数字及特殊字符,长度不超过100个字符。
从故障发生到故障恢复所需时间称为业务中断时间。云运维中心支持将清除告警填写的业务中断时间自动计入对应应用的SLO中断记录。具体操作步骤如下:
- 创建SLA规则,设置触发类型为“告警单”,选择级别和应用(需要包含汇聚告警的级别和应用)。
- 创建SLO规则,选择应用(需要包含汇聚告警应用)。
- 汇聚告警产生后,条件满足SLA记录设置的级别和应用,生成对应的SLA记录。
- 清除汇聚告警,填写故障发生和故障恢复时间,生成SLO中断记录,在对应的SLO规则的操作列查看中断记录。
- 单击“确定”。
完成告警清除。
查看历史告警
历史告警显示的是被清除的汇聚告警。当汇聚告警被清除后,您可以在历史告警页签中继续查看汇聚告警的相关信息和处理记录。
注意:告警数据留存期为31天,逾期将自动清除。
- 登录云运维中心。
- 在左侧导航栏选择“故障管理 > 告警管理”。
- 单击“汇聚告警 > 历史告警”。
查看集成告警列表信息。
- 选择需要查看的告警单击操作列 “更多 > 历史记录” 。
查看当前告警单历史记录。
查看原始告警
原始告警是由多个现有或第三方等监控系统(比如CES、AOM、Prometheus),将业务下分散的告警信息进行统一收集生成的告警。原始告警列表展示告警源名称、告警状态、告警级别、告警来源、关联应用等信息。
通过流转规则可以将一条或多条原始告警汇聚成单条汇聚告警,一条原始告警可以触发多个流转规则。
注意:页面默认显示31天的告警信息,过期的告警将自动清除。
- 登录云运维中心。
- 在左侧导航栏选择“故障管理 > 告警管理”。
- 在“原始告警”页签,单击告警名称。
查看原始告警详情。