更新时间:2026-01-20 GMT+08:00
告警管理概述
告警管理功能提供告警数据的收集、汇聚降噪和流转处理,以及告警规则的配置管理功能。
核心功能特点
- 接入告警源,生成原始告警:支持集成多个现有或第三方等监控系统(比如CES、AOM、Prometheus),并将业务下分散的告警信息进行统一收集,生成原始告警。用户可以在集成管理处启用或禁用已有告警源,或者接入第三方监控系统。
- 结合流转规则,生成汇聚告警:通过设置流转规则,用户可以将接收到的符合指定规则的多条原始告警汇聚成单条告警,称为汇聚告警。
- 处理汇聚告警,恢复资源/应用健康运行:对于汇聚告警,用户可以转事件单处理,或者对其执行脚本和作业,并自动通知相应责任人。汇聚告警减少了重复告警,避免了告警风暴,提高用户处理告警的效率。
注意,初始生成的汇聚告警为当前告警,用户对汇聚告警进行处理、转事件或清除操作后,其会被转移到历史告警中。
图1 告警管理流程
基本概念
- 原始告警:由多个现有或第三方等监控系统(比如CES、AOM、Prometheus),将业务下分散的告警信息进行统一收集生成的告警。
- 汇聚告警:通过设置流转规则,用户可以将接收到的符合指定规则的多条原始告警汇聚成单条告警。
- 当前告警:初始生成的汇聚告警为当前告警。
- 历史告警:显示的是被清除的汇聚告警。当汇聚告警被清除后,您可以在历史告警页签中继续查看汇聚告警的相关信息和处理记录。