更新时间:2024-12-16 GMT+08:00

设置资源监控告警阈值

组件部署方式为容器部署时,当您需要对某些资源进行重点监控并在异常情况下及时响应,可对这些重点资源的指标创建阈值规则,以便您在第一时间发现异常并进行处理。

  • 在已设的连续周期内,当指标数据满足阈值条件时,系统会发送阈值告警。
  • 在已设的连续周期内,当没有指标数据上报时,系统会发送数据不足事件。
  • 由于不在现场,无法通过ServiceStage控制台即时查询阈值规则状态的变更信息时,可通过启用通知将该变更信息以短消息或邮件的方式自动发送给相关人员。

设置资源监控告警阈值

  1. 登录ServiceStage控制台。
  2. 选择以下任意方式进入组件“阈值告警”页面:

    • “应用管理”页面,单击组件所属应用名称,在“组件列表”单击待操作组件名称,在左侧导航栏选择运维 > 阈值告警
    • “组件管理”页面,单击待操作组件名称,在左侧导航栏选择运维 > 阈值告警

    使用使用导入CCE工作负载创建组件方法创建的组件,如果未启用组件:

    1. 在弹出的对话框单击“确认”
    2. “启用组件”页面,单击“启用”,等待组件完成重启。

  3. 单击“阈值规则设置”,参考表1设置阈值规则参数信息。其中带“*”标志的参数为必填参数。

    表1 阈值规则参数说明

    参数

    说明

    *阈值名称

    阈值规则的名称,长度不能超过255个字符。

    说明:

    命名必须唯一,且创建后不能再修改。

    描述

    描述信息,长度不能超过255个字符。

    统计方式

    指标数据按照所设置的统计方式进行聚合,包括:平均值、最小值、最大值、总计、样本个数。

    统计周期

    指标数据按照所设置的统计周期进行聚合。

    选择指标

    选择需要监控的指标。

    *阈值条件

    阈值告警的触发条件,由判断条件(>=、<=、>、<)和阈值组成。

    例如,“阈值条件”设置为“>=80”,表示指标的实际值大于或等于已设置的阈值80时,系统将产生阈值告警。

    连续周期

    连续多少个周期满足阈值条件后,发送阈值告警。

    告警级别

    阈值告警的级别,包括:紧急、重要、次要、提示。

    发送通知

    选择是否发送通知。

    • 选择“是”(推荐选择),触发产生的阈值告警消息由消息通知服务SMN发送通知给用户,可能产生的费用由SMN结算。
    • 选择“否”,不会通知用户。

    *主题名称

    “发送通知”选择“是”时,选择已创建的主题。

    主题是消息发布或客户端订阅通知的特定事件类型,作为发送消息和订阅通知的信道,为发布者和订阅者提供一个可以相互交流的通道。

    创建主题,请参见创建主题

    *触发场景

    “发送通知”选择“是”时,发送通知的触发条件。

    • 出现告警:当出现阈值告警时,系统会将该变更信息以邮件或短信方式发送给指定用户。
    • 恢复正常:当告警恢复正常时,系统会将该变更信息以邮件或短信方式发送给指定用户。

  4. 单击“确定”。

后续操作

阈值规则创建完成后,您还可以按照表2中的步骤来管理阈值告警。

表2 管理阈值告警相关操作

操作

说明

修改阈值告警

当您发现当前的阈值规则设置不合理时,您可以参考如下操作对阈值规则进行修改,以便更好的满足您的业务需求。

  1. 单击阈值告警列表“操作”列的“修改”。
  2. 在“修改阈值规则”页面中根据界面提示修改阈值规则的相关参数。
  3. 单击“修改”。

删除阈值告警

随着业务的变动,当您发现当前的阈值规则已不再需要时,您可以参考如下操作删除阈值规则,以便释放更多的阈值规则资源。

  1. 删除阈值规则。
    • 删除单个阈值:单击阈值规则列表“操作”列的“删除”。
    • 批量删除阈值规则:选中单个或多个阈值规则前的复选框,单击页面上方的“删除”。
  2. 在弹出的对话框中单击“确定”。

搜索阈值告警

  1. 在下拉列表框中选择时间段。
  2. 在页面右上角的搜索框中输入阈值告警名称或描述的关键字。
  3. 单击,或在键盘上按“Enter”键。

    也可单击“高级搜索”设置搜索条件,单击“搜索”进行查询。

查看阈值告警

在已设的连续周期内,当指标数据满足阈值条件时,系统会发送阈值告警。

在阈值告警列表中查看该告警。

查看历史告警

单击阈值规则列表“操作”列的“历史记录”,查看历史告警。

查看数据不足事件

在已设的连续周期内,当没有指标数据上报时,系统会发送数据不足事件。

可在“事件”页面查看该事件,请参考查看组件运行事件