更新时间:2025-10-29 GMT+08:00
分享

配置监控告警

操作场景

通过设置专属计算集群的告警规则和告警通知,用户可收到告警信息,及时了解专属计算集群容量情况,从而起到预警作用。

本节介绍了设置专属计算集群告警规则的具体方法。

当前仅个别区域支持使用CES监控DCC,具体以控制台界面显示为准。

前提条件

设置告警规则操作,需要您具有CES FullAccess角色权限,若提示权限不足,请联系管理员进行授权,详细内容,请参见权限管理

计费说明

告警基础功能免费,触发产生的告警消息由消息通知服务发送,可能产生少量费用,具体费用请参考消息通知服务的计费说明

监控指标

表1 DCC配置告警的指标

指标名称

正常范围

告警策略

是否接近容量上限

指标说明和告警处理建议

主机CPU分配率

0~100

告警阈值:原始值>90

连续触发次数:3

告警级别:紧急

指标说明:该指标为主机维度CPU的分配率情况。单位:%。

处理建议:出现该告警时,说明主机CPU可用资源不足10%,可通过新购主机扩大资源池,避免资源不足导致发放虚拟机失败。

主机内存分配率

0~100

告警阈值:原始值>90

连续触发次数:3

告警级别:紧急

指标说明:该指标为主机维度内存的分配率情况。单位:%。

处理建议:出现该告警时,说明主机内存可用资源不足10%,可通过新购主机扩大资源池,避免资源不足导致发放虚拟机失败。

资源池CPU分配率

0~100

告警阈值:原始值>90

连续触发次数:3

告警级别:紧急

指标说明:该指标为资源池维度CPU的分配率情况。单位:%。

处理建议:出现该告警时,说明资源池CPU可用资源不足10%,可通过新购主机扩大资源池,避免资源不足导致发放虚拟机失败。

资源池内存分配率

0~100

告警阈值:原始值>90

连续触发次数:3

告警级别:紧急

指标说明:该指标为资源池维度内存的分配率情况。单位:%。

处理建议:出现该告警时,说明资源池内存可用资源不足10%,可通过新购主机扩大资源池,避免资源不足导致发放虚拟机失败。

操作步骤

  1. 登录CES控制台
  2. 在左侧导航树栏,选择“告警 > 告警规则”。
  3. 在“告警规则”界面,单击“创建告警规则”。

    也可以选择已有的告警规则进行修改,设置专属计算集群的告警规则。

  4. 根据界面提示,配置告警规则的基本信息。
    图1 告警规则基本信息
    表2 基本信息参数说明

    参数

    参数说明

    取值样例

    名称

    系统会随机产生一个名称,用户也可以进行修改。

    alarm-cprn

    描述

    告警规则描述(此参数非必填项)。

    -

  5. 选择监控对象,配置告警内容参数。
    图2 DCC监控指标告警配置

    关键参数如下,更多配置参数信息,请参见创建告警规则和通知

    • 告警类型:告警规则适用的告警类型,此处选择指标,可针对DCC监控指标创建告警规则。。
    • 资源类型:当告警类型选择指标时,需配置告警规则监控的服务名称。例如,专属计算集群。
    • 维度:监控对象的资源层级。根据业务需要选择集群或主机。
    • 监控范围:告警规则适用的资源范围,可选择全部资源、资源分组或指定资源。
    • 触发规则:根据需要可选择关联模板或自定义创建。

      选择关联模板后,所关联模板内容修改后,该告警规则中所包含策略也会跟随修改。

  6. 根据界面提示,配置告警通知参数。

    如果要配置通过邮件、短信、HTTP和HTTPS向用户发送告警通知,则设置“发送通知”为开启。

    更多配置参数信息,请参见创建告警规则和通知

  7. 配置完成后,单击“立即创建”,完成告警规则的创建。

    更多关于云监控规则的信息,请参见《云监控用户指南》

相关文档