更新时间:2025-08-20 GMT+08:00
分享

AOM告警规则概述

AOM提供告警规则和事件规则设置功能。通过创建指标、日志、云监控和应用性能监控告警规则,实时监控环境中主机、组件等资源使用情况,便于您更快地发现、定位并恢复故障。通过创建事件告警规则,简化告警通知,快速识别服务的某一类资源使用问题并及时解决。

功能说明

  • 指标告警规则

    通过指标告警规则可对资源的指标设置阈值条件,当指标数据满足阈值条件时产生阈值告警,当没有指标数据上报时产生数据不足事件。

  • 事件告警规则

    通过事件告警规则可对服务设置事件条件,当服务发生了某种变化,资源数据满足事件条件时产生事件类告警。

  • 应用性能监控告警规则

    通过创建应用性能监控类型告警规则可对资源的指标设置阈值条件,当指标数据满足阈值条件时产生阈值告警。

  • 日志告警规则

    AOM支持通过关键词统计、搜索分析以及SQL统计创建告警规则,实时监控日志数据并上报告警信息。

  • 云监控告警规则

    云监控服务支持灵活地创建告警规则。您既可以根据实际需要对某个特定的监控指标设置自定义告警规则,同时也支持使用告警模板为多个资源或者云服务批量创建告警规则。

  • 告警模板

    告警模板是一组以云服务为单位的告警规则组合,通过告警模板用户可对同一个云服务下的多个指标批量创建阈值告警规则、事件告警规则和PromQL告警规则。

约束与限制

系统支持创建的指标告警规则、事件告警规则、应用性能监控告警规则总计不能超过3000条。如果系统中的告警规则数量已达到上限,请删除不需要的告警规则后重新创建。

当您进入告警规则页面后,界面会弹出“开启告警规则执行历史记录”的提示框,您可以根据实际需求单击“一键开启”或单击“前往设置开启”开启“告警规则执行历史”开关。开关开启后,Prometheus监控和日志监控告警规则执行日志将上报到LTS日志流alarm-execution-history(日志组为lts-system)中,您可以查看告警规则的历次执行情况、告警是否触发、是否发送通知、通知内容和通知渠道等信息。会产生少量日志费用,LTS计费详情请参考LTS计费项说明。如果您暂不需要查看告警规则执行历史记录,可勾选“不再提示”前的复选框,取消提示信息。当前“开启告警规则执行历史记录”的提示框功能受限部分区域开放,如有需求可以通过提交工单,联系工程师为您开放此功能。

相关文档