更新时间:2025-08-08 GMT+08:00

告警管理概述

告警管理功能提供告警数据的收集、汇聚降噪和流转处理,以及告警规则的配置管理功能。

核心功能特点

  • 接入告警源,生成原始告警:支持集成多个现有或第三方等监控系统(比如CES、AOM、Prometheus),并将业务下分散的告警信息进行统一收集,生成原始告警。用户可以在集成管理处启用或禁用已有告警源,或者接入第三方监控系统。
  • 结合流转规则,生成汇聚告警:通过设置流转规则,用户可以将接收到的符合指定规则的多条原始告警汇聚成单条告警,称为汇聚告警。
  • 处理汇聚告警,恢复资源/应用健康运行:对于汇聚告警,用户可以转事件单处理,或者对其执行脚本和作业,并自动通知相应责任人。汇聚告警减少了重复告警,避免了告警风暴,提高用户处理告警的效率。
  • 告警规则管理:本功能还可以帮助用户高效创建和管理告警规则。其提供了跨账号、跨区域的告警规则配置能力,帮助用户提高批量配置的效率。告警规则目前仅支持CES告警的配置。

注意,初始生成的汇聚告警为当前告警,用户对汇聚告警进行处理、转事件或清除操作后,其会被转移到历史告警中。

图1 告警管理流程