更新时间:2025-08-21 GMT+08:00
分享

主机监控

在视频直播中,弹性云服务器作为核心基础,细微的性能变化,可能会引起云服务上的业务受到大幅震荡。为了监控更细颗粒度的监控指标,可以在弹性云服务器中安装配置Agent

本章节介绍如何对弹性云服务器的CPU使用率、内存使用率、磁盘使用率设置告警规则。并在弹性伸缩中配置弹性伸缩策略,当CPU使用率连续5分钟内连续5次达到90%时,系统自动增加一个实例以保证业务平稳运行。

告警规则与伸缩策略创建完成后,当业务量飙升,监控指标触发设定的阈值时,系统自动增加一个实例并在第一时间通过消息通知服务的Notification中的电话和短信实时告知资源异常,提醒您处理,以免因此造成业务损失。

背景信息

CPU使用率、内存使用率、磁盘使用率等为ECS基础监控的指标。(Agent)使用率、(Agent)内存使用率、(Agent)磁盘使用率等为细粒度(分钟级)监控指标。

创建告警规则

  1. 登录管理控制台。
  2. 在管理控制台左上角选择区域和项目。
  3. 单击“服务列表 > 云监控服务”。
  4. 单击页面左侧的“主机监控 > 弹性云服务器”,进入主机监控页面。
  5. 单击弹性云服务器所在栏右侧的“更多”按钮,选择“创建告警规则”。
  6. 在“创建告警规则”界面,已选定监控对象,触发规则选择“自定义创建”后配置告警策略。
    图1 创建告警规则
    表1 告警策略说明

    参数

    示例

    说明

    指标名称

    告警策略1:云服务器 > (Agent)CPU使用率

    告警策略2:云服务器 > (Agent)内存使用率

    告警策略3:云服务器 - 挂载点 > (Agent)磁盘使用率

    选择触发告警的指标

    指标值类型

    平均值 > 1小时

    监控的指标值类型。分为原始值、平均值、最大值、最小值、方差值和求和值6种。

    连续触发次数

    连续三次

    当告警连续多少次被触发时,发送告警信息。

    比较关系

    >=

    比较检测指标值和阈值的关系。

    阈值

    重要80%、紧急90%

    设置告警触发的阈值和单位。

    告警频率

    每1天告警一次

    当告警产生时,告警以特定的频率重复通知。

  7. 根据界面提示,配置告警通知参数。更多告警通知参数请参考创建告警规则和通知
    表2 主机监控告警通知配置说明

    参数

    示例

    说明

    发送通知

    开启

    当触发设置的告警条件时,是否发送告警通知。

    通知方式

    主题订阅

    选择告警通知方式

    通知对象

    云账号联系人

    • 当通知方式选择主题订阅时,需要选择发送告警通知的对象。
    • 当通知对象选择云账号联系人时,会发送告警通知到注册时的手机和邮箱。

    生效时间

    00:00-23:59

    • 当通知方式选择主题订阅时,需要设置生效时间。
    • 系统仅在生效时间内发送告警通知消息。

    触发条件

    依次勾选出现告警、恢复正常

    当通知方式选择通知组或者主题订阅时,可以选择“出现告警”、“恢复正常”两种状态,作为触发告警通知的条件。

    “告警通知”功能触发产生的告警消息由消息通知服务SMN发送,可能产生少量费用,具体费用请参考产品价格说明

配置伸缩策略

  1. 单击“计算 > 弹性伸缩”。
  2. 在弹性伸缩组页面,单击“创建弹性伸缩组”,创建伸缩组请参见创建伸缩组
  3. 创建完成后,单击伸缩组所在行的“查看伸缩策略”。
  4. 在“查看伸缩策略”页面,单击“添加伸缩策略”,进入添加伸缩策略页面,参照图2完成参数配置。
    图2 配置弹性伸缩策略

相关文档