配置监控告警
操作场景
通过设置专属计算集群的告警规则和告警通知,用户可收到告警信息,及时了解专属计算集群容量情况,从而起到预警作用。
本节介绍了设置专属计算集群告警规则的具体方法。
 
   当前仅个别区域支持使用CES监控DCC,具体以控制台界面显示为准。
监控指标
| 
        指标名称  | 
      
        正常范围  | 
      
        告警策略  | 
      
        是否接近容量上限  | 
      
        指标说明和告警处理建议  | 
     
|---|---|---|---|---|
| 
        主机CPU分配率  | 
      
        0~100  | 
      
        告警阈值:原始值>90 连续触发次数:3 告警级别:紧急  | 
      
        是  | 
      
        指标说明:该指标为主机维度CPU的分配率情况。单位:%。 处理建议:出现该告警时,说明主机CPU可用资源不足10%,可通过新购主机扩大资源池,避免资源不足导致发放虚拟机失败。  | 
     
| 
        主机内存分配率  | 
      
        0~100  | 
      
        告警阈值:原始值>90 连续触发次数:3 告警级别:紧急  | 
      
        是  | 
      
        指标说明:该指标为主机维度内存的分配率情况。单位:%。 处理建议:出现该告警时,说明主机内存可用资源不足10%,可通过新购主机扩大资源池,避免资源不足导致发放虚拟机失败。  | 
     
| 
        资源池CPU分配率  | 
      
        0~100  | 
      
        告警阈值:原始值>90 连续触发次数:3 告警级别:紧急  | 
      
        是  | 
      
        指标说明:该指标为资源池维度CPU的分配率情况。单位:%。 处理建议:出现该告警时,说明资源池CPU可用资源不足10%,可通过新购主机扩大资源池,避免资源不足导致发放虚拟机失败。  | 
     
| 
        资源池内存分配率  | 
      
        0~100  | 
      
        告警阈值:原始值>90 连续触发次数:3 告警级别:紧急  | 
      
        是  | 
      
        指标说明:该指标为资源池维度内存的分配率情况。单位:%。 处理建议:出现该告警时,说明资源池内存可用资源不足10%,可通过新购主机扩大资源池,避免资源不足导致发放虚拟机失败。  | 
     
操作步骤
- 登录CES控制台。
 - 在左侧导航树栏,选择“告警 > 告警规则”。
 - 在“告警规则”界面,单击“创建告警规则”。
 - 根据界面提示,配置告警规则的基本信息。
    图1 告警规则基本信息
    表2 基本信息参数说明 参数
参数说明
取值样例
名称
系统会随机产生一个名称,用户也可以进行修改。
alarm-cprn
描述
告警规则描述(此参数非必填项)。
-
 - 选择监控对象,配置告警内容参数。
    图2 DCC监控指标告警配置
    关键参数如下,更多配置参数信息,请参见创建告警规则和通知:
- 告警类型:告警规则适用的告警类型,此处选择指标,可针对DCC监控指标创建告警规则。。
 - 资源类型:当告警类型选择指标时,需配置告警规则监控的服务名称。例如,专属计算集群。
 - 维度:监控对象的资源层级。根据业务需要选择集群或主机。
 - 监控范围:告警规则适用的资源范围,可选择全部资源、资源分组或指定资源。
 - 触发规则:根据需要可选择关联模板或自定义创建。
      
 
       选择关联模板后,所关联模板内容修改后,该告警规则中所包含策略也会跟随修改。
 
 - 根据界面提示,配置告警通知参数。
    
如果要配置通过邮件、短信、HTTP和HTTPS向用户发送告警通知,则设置“发送通知”为开启。
更多配置参数信息,请参见创建告警规则和通知。
 - 配置完成后,单击“立即创建”,完成告警规则的创建。