更新时间:2026-01-20 GMT+08:00
分享

告警管理概述

告警管理功能提供告警数据的收集、汇聚降噪和流转处理,以及告警规则的配置管理功能。

核心功能特点

  • 接入告警源,生成原始告警:支持集成多个现有或第三方等监控系统(比如CES、AOM、Prometheus),并将业务下分散的告警信息进行统一收集,生成原始告警。用户可以在集成管理处启用或禁用已有告警源,或者接入第三方监控系统。
  • 结合流转规则,生成汇聚告警:通过设置流转规则,用户可以将接收到的符合指定规则的多条原始告警汇聚成单条告警,称为汇聚告警。
  • 处理汇聚告警,恢复资源/应用健康运行:对于汇聚告警,用户可以转事件单处理,或者对其执行脚本和作业,并自动通知相应责任人。汇聚告警减少了重复告警,避免了告警风暴,提高用户处理告警的效率。

注意,初始生成的汇聚告警为当前告警,用户对汇聚告警进行处理、转事件或清除操作后,其会被转移到历史告警中。

图1 告警管理流程

基本概念

  • 原始告警:由多个现有或第三方等监控系统(比如CES、AOM、Prometheus),将业务下分散的告警信息进行统一收集生成的告警。
  • 汇聚告警:通过设置流转规则,用户可以将接收到的符合指定规则的多条原始告警汇聚成单条告警。
  • 当前告警:初始生成的汇聚告警为当前告警。
  • 历史告警:显示的是被清除的汇聚告警。当汇聚告警被清除后,您可以在历史告警页签中继续查看汇聚告警的相关信息和处理记录。

相关文档