更新时间:2025-08-01 GMT+08:00

使用CES监控Snt9B23超节点健康状况

本章节旨在提供一种监控Snt9B23超节点健康状态的方法,该方法支持以短信、邮件等方式通知用户故障信息,并支持通过API查询故障记录。

约束限制

  • 本方案基于CES的告警规则实现,由于CES允许每个账号最多创建100个告警规则,因此本方案最多可以监控100个超节点。
  • 告警来源基于CES故障检测事件,因此需要开启CES主机监控委托。可以在购买超节点时开启,也可以购买后在CES控制台授权,具体参考CES-权限管理
  • 告警通知使用的是消息通知服务(SMN)提供的短信、邮件等功能,会产生少量费用,具体价格请参考产品价格说明

操作步骤

  1. 登录CES控制台
  2. 创建告警规则模板。
    表1 参数说明

    属性

    建议值

    名称

    建议以故障等级命名,例如,超节点亚健康。

    告警类型

    事件

    触发规则

    选择“自定义创建”。其它参数建议如下:

    • 事件名称:参考Lite Server支持的事件列表,根据事件影响选择需要关注的事件。
    • 告警策略:在5分钟内累计发生4次则只告警一次。注意,不合理的配置可能导致告警过多或响应过慢。
    • 告警级别:重要
  3. 创建告警规则。
    表2 告警规则参数说明

    属性

    建议值

    名称

    建议采用“超节点名称_故障等级”格式,例如“SuperPod_01_亚健康”。

    告警类型

    事件

    事件类型

    系统事件

    事件来源

    弹性云服务器

    监控范围

    指定资源

    监控对象

    超节点内所有子节点。单击选择指定资源,搜索超节点名称,勾选所有,单击“确定”

    触发规则

    自定义创建。

    告警策略

    勾选引用模板,在下拉列表框中选择第2.创建告警规则模板。步创建的告警模板。

    发送通知

    可选,如果希望以短信、邮件、HTTP、HTTPS等方式收到告警通知,打开此开关。

    消息通知服务会从短信、邮件、HTTP、HTTPS的使用中收费,具体价格请参考产品价格说明

    通知对象

    可选,当允许发送通知时,才会有此选项。建议创建新主题。

    生效时间

    可选,当允许发送通知时,才会有此选项。

    建议采用默认值。

    触发条件

    可选,当允许发送通知时,才会有此选项。

    建议采用默认值。

    归属企业项目

    根据实际情况选择。

  4. 创建主题(可选)
    表3 创建主题参数说明

    属性

    建议值

    主题名称

    建议为显示名的英文。例如,SuperPod-Sub-Health。

    显示名

    推送邮件消息时,邮件主题呈现的名称,建议显示故障级别。例如,超节点亚健康。

    企业项目

    根据实际情况选择。

  5. 添加订阅(可选)。创建主题后就可以添加订阅,以收到告警通知。

    添加订阅后,终端会收到确认订阅的消息通知,单击订阅确认后,才能收到告警通知。

邮件告警通知样例

邮件告警通知中,邮件主题显示了告警的级别,邮件内容显示了告警对象、告警策略以及告警时间等关键信息,并且告警规则中包含了故障对象所属的超节点名称。告警处理可以参考Lite Server支持的事件列表,根据处理建议进行处理。

查询告警记录

可以通过API查询告警记录,具体可参考CES文档查询告警记录列表