更新时间:2024-11-22 GMT+08:00

创建告警规则和通知

本章节指导用户如何创建告警规则。

创建告警规则

  1. 登录管理控制台。
  2. 单击“服务列表 > 云监控服务”。
  3. 选择“告警 > 告警规则”。
  4. 单击“创建告警规则”。
  5. 在“创建告警规则”界面,根据界面提示配置参数。
    1. 根据界面提示,配置告警规则的基本信息
      图1 基本信息
      表1 配置规则信息

      参数

      参数说明

      名称

      系统会随机产生一个名称,用户也可以进行修改。

      取值样例:alarm-b6al

      描述

      告警规则描述(此参数非必填项)。

    2. 选择监控对象,配置告警内容参数。
      图2 配置告警内容

      表2 配置告警内容

      参数

      参数说明

      取值样例

      告警类型

      告警规则适用的告警类型,可选择指标、事件告警类型。

      指标

      云产品

      当告警类型选择指标时,需配置告警规则监控的服务名称。

      支持的云产品以及云产品对应的监控指标说明,请参见云产品监控指标

      弹性云服务器-云服务器

      资源层级

      当告警类型选择指标时,需选择告警规则的资源层级,可选择云产品或子维度,推荐选择云产品。

      以弹性云服务器ECS为例:用户购买了云产品(ECS虚拟机),根据指标划分了多个子维度(包含磁盘、挂载点、进程等)。

      云产品

      监控范围

      当告警类型选择指标时,需选择告警规则适用的资源范围,可选择全部资源、资源分组或指定资源。

      说明:
      • 选择“全部资源”时,则当前云产品下任何资源满足告警策略时,都会触发告警。可单击“选择排除资源”排除不需要监控的资源。
      • 选择“资源分组”时,该分组下任何资源满足告警策略时,都会触发告警。可单击“选择排除资源”排除不需要监控的资源。
      • 选择“指定资源”时,在“监控对象”单击“选择指定资源”进行指定资源的选择。

      全部资源

      分组

      当告警类型选择指标,且监控范围选择资源分组时需配置此参数。

      -

      监控对象

      当告警类型选择指标,且监控范围选择指定资源时需配置此参数。

      -

      条件类型

      针对弹性云服务器,您可以选择静态阈值和动态阈值。当前仅在华南-广州上线。

      • 静态阈值:指告警触发规则设置成固定的阈值,如果指标达到设置的阈值,则触发告警。
      • 动态阈值:指告警触发阈值是根据智能计算指标的历史数据预测指标的阈值,若实际值偏离预测值,则触发告警。

      静态阈值

      事件类型

      当告警类型选择事件时,需要选择事件类型,可选择系统事件或自定义事件。

      系统事件

      事件来源

      当告警类型选择事件时,需要设置事件来源。

      • 当事件类型选择系统事件时,需要选择事件来源的云服务名称。

        取值样例:弹性云服务器

      • 当事件类型选择自定义事件,事件来源需要与上报的字段一致,格式需要为service.item形式。

      -

      触发规则

      • 自定义创建:当告警类型选择事件,且事件类型选择自定义事件时,触发规则默认为自定义创建。
      • 关联模板:选择关联模板后,所关联模板内容修改后,该告警规则中所包含策略也会跟随修改。
        说明:
        • 当“资源层级”选择“云产品”时,关联模板中指定云产品策略修改后,会自动同步,其他云产品策略修改后不会自动同步。
        • 当“资源层级”选择“子维度”时,模板中指定维度的策略修改后,会自动同步,其他维度策略修改后不会自动同步。

        例如:“资源层级”选择“子维度”,子维度为弹性云服务器,修改模板中弹性云服务器策略,会自动同步到告警规则中,修改弹性云服务器-磁盘策略,则不会自动同步。

      自定义创建

      模板

      当告警类型选择指标且触发规则选择关联模板时,或告警类型选择事件且事件类型为系统事件时,需要选择导入的模板。

      您可以选择系统预置的默认告警模板,或者选择自定义模板。

      -

      告警策略

      当告警类型选择事件且事件类型为自定义事件时,需要设置触发告警规则的告警策略。

      当事件类型为自定义事件时,触发告警具体的事件为一个瞬间的事件。例如运行状态异常,则触发告警。

      详情请参见告警策略

      说明:

      告警规则内最多可添加50条告警策略,若其中一条告警策略达到条件都会触发告警。

      -

      告警级别

      根据告警的严重程度不同等级,可选择紧急、重要、次要、提示。

      重要

    3. 根据界面提示,配置告警通知参数。
      图3 配置告警通知

      表3 配置告警通知

      参数

      参数说明

      发送通知

      配置是否发送短信、邮件、语音通知、HTTP、HTTPS、FunctionGraph(函数)、FunctionGraph(工作流)、企业微信、钉钉、飞书或Welink通知用户。

      通知方式

      根据需要可选择通知组或主题订阅的方式。

      • 通知组的通知内容模板在云监控服务配置。
      • 主题订阅的通知内容模板需要在消息通知服务配置。

      通知策略

      当通知方式选择通知策略时,需要选择告警通知的策略。通知策略是包含通知组选择、生效时间、通知内容模板等参数的组合编排。创建通知策略请参见创建/修改/删除通知策略

      通知组

      当通知方式选择通知组时,需要选择发送告警通知的通知组。

      通知对象

      当通知方式选择主题订阅时,需要发送告警通知的对象,可选择云账号联系人或主题名称。

      • 云账号联系人为注册时的手机和邮箱。
      • 主题是消息发布或客户端订阅通知的特定事件类型,若此处没有需要的主题则需先创建主题并添加订阅,创建主题并添加订阅请参见创建主题添加订阅

      通知内容模板

      当通知方式选择通知组或主题订阅时,可选择已有模板或创建通知内容模板。

      生效时间

      当通知方式选择通知组或主题订阅时,需要设置生效时间。

      该告警仅在生效时间段发送通知消息,非生效时段则在隔日生效时段发送通知消息。

      如生效时间为08:00-20:00,则该告警规则仅在08:00-20:00发送通知消息。

      触发条件

      当通知方式选择通知组或主题订阅时,需要设置触发条件。

      可以选择“出现告警”、“恢复正常”两种状态,作为触发告警通知的条件。

      说明:

      当告警类型为事件时,只支持选择“出现告警”作为触发告警通知的条件。

    4. 根据界面提示,配置归属企业项目和标签。
      图4 高级配置
      表4 配置规则信息

      参数

      参数说明

      归属企业项目

      告警规则所属的企业项目。只有拥有该企业项目权限的用户才可以查看和管理该告警规则。创建企业项目请参考:创建企业项目

      标签

      标签由键值对组成,用于标识云资源,可对云资源进行分类和搜索。建议在TMS中创建预定义标签。创建预定义标签请参考:创建预定义标签

      如您的组织已经设定云监控的相关标签策略,则需按照标签策略规则为告警规则添加标签。标签如果不符合标签策略的规则,则可能会导致告警规则创建失败,请联系组织管理员了解标签策略详情。

      • 键的长度最大128字符,值的长度最大225字符。
      • 最多可创建20个标签。
    5. 配置完成后,单击“立即创建”,完成告警规则的创建。

告警规则添加完成后,当监控指标触发设定的阈值时,云监控服务会在第一时间通过消息通知服务实时告知您云上资源异常,以免因此造成业务损失。