配置监控告警
操作场景
通过设置专属计算集群的告警规则和告警通知,用户可收到告警信息,及时了解专属计算集群容量情况,从而起到预警作用。
本节介绍了设置专属计算集群告警规则的具体方法。
当前仅个别区域支持使用CES监控DCC,具体以控制台界面显示为准。
监控指标
|
指标名称 |
正常范围 |
告警策略 |
是否接近容量上限 |
指标说明和告警处理建议 |
|---|---|---|---|---|
|
主机CPU分配率 |
0~100 |
告警阈值:原始值>90 连续触发次数:3 告警级别:紧急 |
是 |
指标说明:该指标为主机维度CPU的分配率情况。单位:%。 处理建议:出现该告警时,说明主机CPU可用资源不足10%,可通过新购主机扩大资源池,避免资源不足导致发放虚拟机失败。 |
|
主机内存分配率 |
0~100 |
告警阈值:原始值>90 连续触发次数:3 告警级别:紧急 |
是 |
指标说明:该指标为主机维度内存的分配率情况。单位:%。 处理建议:出现该告警时,说明主机内存可用资源不足10%,可通过新购主机扩大资源池,避免资源不足导致发放虚拟机失败。 |
|
资源池CPU分配率 |
0~100 |
告警阈值:原始值>90 连续触发次数:3 告警级别:紧急 |
是 |
指标说明:该指标为资源池维度CPU的分配率情况。单位:%。 处理建议:出现该告警时,说明资源池CPU可用资源不足10%,可通过新购主机扩大资源池,避免资源不足导致发放虚拟机失败。 |
|
资源池内存分配率 |
0~100 |
告警阈值:原始值>90 连续触发次数:3 告警级别:紧急 |
是 |
指标说明:该指标为资源池维度内存的分配率情况。单位:%。 处理建议:出现该告警时,说明资源池内存可用资源不足10%,可通过新购主机扩大资源池,避免资源不足导致发放虚拟机失败。 |
操作步骤
- 登录CES控制台。
- 在左侧导航树栏,选择“告警 > 告警规则”。
- 在“告警规则”界面,单击“创建告警规则”。
- 根据界面提示,配置告警规则的基本信息。
图1 告警规则基本信息
表2 基本信息参数说明 参数
参数说明
取值样例
名称
系统会随机产生一个名称,用户也可以进行修改。
alarm-cprn
描述
告警规则描述(此参数非必填项)。
-
- 选择监控对象,配置告警内容参数。
图2 DCC监控指标告警配置
关键参数如下,更多配置参数信息,请参见创建告警规则和通知:
- 告警类型:告警规则适用的告警类型,此处选择指标,可针对DCC监控指标创建告警规则。。
- 资源类型:当告警类型选择指标时,需配置告警规则监控的服务名称。例如,专属计算集群。
- 维度:监控对象的资源层级。根据业务需要选择集群或主机。
- 监控范围:告警规则适用的资源范围,可选择全部资源、资源分组或指定资源。
- 触发规则:根据需要可选择关联模板或自定义创建。
选择关联模板后,所关联模板内容修改后,该告警规则中所包含策略也会跟随修改。
- 根据界面提示,配置告警通知参数。
如果要配置通过邮件、短信、HTTP和HTTPS向用户发送告警通知,则设置“发送通知”为开启。
更多配置参数信息,请参见创建告警规则和通知。
- 配置完成后,单击“立即创建”,完成告警规则的创建。