更新时间:2023-06-25 GMT+08:00

添加阈值

该功能对非洲-约翰内斯堡、拉美-墨西哥城一、拉美-墨西哥城二、拉美-圣保罗一和拉美-圣地亚哥区域生效。

通过阈值规则可对资源的指标设置阈值条件。当指标数据满足阈值条件时产生阈值告警,当没有指标数据上报时产生数据不足事件。

AOM已对接消息通知服务(Simple Message Notification,简称SMN),通过在SMN界面设置通知策略,当阈值规则的状态(正常、超限阈值、数据不足)发生变化时,会以邮件或短信等方式通知,以便您在第一时间发现异常并进行处理。

注意事项

  • 您最多可创建1000条阈值规则,如果阈值规则数量已达上限1000条时,请删除不需要的阈值规则后重新创建。
  • 设置通知策略
    阈值规则的状态(正常、超限阈值、数据不足)发生变化时,如需使用邮件或短信等方式发送通知,请参考下面操作在SMN界面设置通知策略。如不需接收邮件或短信通知,请跳过下面操作。具体操作如下:
    1. 创建一个主题,操作详见创建主题
    2. 设置主题策略,操作详见设置主题策略

      设置主题策略时,“可发布消息的服务”必须选择“APM”,否则会导致通知发送失败。

    3. 为主题添加相关的订阅者,即通知的接收人(例如:邮件或短信),操作详见订阅主题

创建阈值规则

  1. 登录AOM控制台,在左侧导航栏中选择“告警 > 阈值规则”,单击右上角的“添加阈值”。
  2. 自定义阈值规则。

    1. 选择资源:在“阈值名称”文本框中输入阈值规则名称,选择资源类型,在资源树上选择待监控的资源,单击“下一步”。
      • 资源树上最多可选择100个资源。
      • 当选择多个资源时,创建操作完成后,会创建多个单条阈值规则,每个资源对应一个单条阈值规则。规则命名方式为:您在“阈值名称”文本框中设置的阈值规则名称加上0至9的序号(序号和资源选择时的先后顺序有关,先选择的资源序号越小,后选择的资源序号越大)。
      图1 选择资源
    2. 定义阈值:选择待监控的指标,设置阈值条件、连续周期、告警级别、统计方式等参数,选择是否发送通知。
      • 阈值条件:阈值告警的触发条件,由判断条件(>=、<=、>、<)和阈值组成。例如,阈值条件设置为“>85”,表示指标的实际值大于已设置的阈值85时,生成阈值告警。
      • 连续周期:连续多少个周期满足阈值条件后,发送阈值告警。
      • 统计方式:指标数据按照所设置的统计方式进行聚合。
      • 统计周期:指标数据按照所设置的统计周期进行聚合。
      • 选择是否发送通知:当阈值规则的状态(正常、超限阈值、数据不足)发生变化时,选择是否发送邮件或短信通知该变动。
        • 如需使用邮件或短信方式发送通知,请选择“是”,则需设置通知策略,选择已创建的主题,选择触发场景。
        • 如不需接收邮件或短信通知,请选择“否”。
      • 触发场景:发送通知的触发条件。

        触发场景您可选择多个。例如,当阈值状态变为超限阈值时,您需要收到通知,则触发场景选择超限阈值;只要阈值状态发生变化时,您都需要收到通知,则触发场景可以全选。

      图2 定义阈值

  3. 单击“添加”,完成创建。如下图所示,创建了多个单条阈值规则,一个资源对应一个规则,可使用独立的规则对某个资源进行监控。

    如下图所示,对于一个单条阈值规则,其监控对象为某个主机,当主机的CPU使用率超过85%时,在告警界面产生阈值告警,可在左侧导航栏中选择“告警> 告警列表”,在告警列表中查看该告警;当主机满足已设的通知策略时,就会发送邮件或短信。

    图3 单条阈值规则

更多阈值规则操作

阈值规则创建完成后,您还可以执行表1中的操作。

表1 相关操作

操作

说明

修改阈值规则

单击“操作”列的“修改阈值”。

删除阈值规则

  • 删除一个阈值规则:单击“操作”列的“删除”。
  • 删除一个或多个阈值规则:选中一个或多个阈值规则前的复选框,单击页面上方的“删除”。

搜索阈值规则

支持规则名称、描述和指标名称搜索,可在右上角的搜索框中输入关键字,单击后显示匹配对象。

查看告警

在已设的连续周期内,当某个资源的指标数据满足阈值条件时,产生一条阈值告警。

可在左侧导航栏中选择“告警> 告警列表”,在告警列表中查看该告警。

查看事件

在已设的连续周期内,当某个资源没有指标数据上报时,会产生一条数据不足的事件。

可在左侧导航栏中选择“告警> 事件列表”,在事件列表中查看该事件。