主机监控
在视频直播中,弹性云服务器作为核心基础,细微的性能变化,可能会引起云服务上的业务受到大幅震荡。为了监控更细颗粒度的监控指标,可以在弹性云服务器中安装配置Agent。
本章节介绍如何对弹性云服务器的CPU使用率、内存使用率、磁盘使用率设置告警规则。并在弹性伸缩中配置弹性伸缩策略,当CPU使用率连续5分钟内连续5次达到90%时,系统自动增加一个实例以保证业务平稳运行。
告警规则与伸缩策略创建完成后,当业务量飙升,监控指标触发设定的阈值时,系统自动增加一个实例并在第一时间通过消息通知服务的Notification中的电话和短信实时告知资源异常,提醒您处理,以免因此造成业务损失。
背景信息
CPU使用率、内存使用率、磁盘使用率等为ECS基础监控的指标。(Agent)使用率、(Agent)内存使用率、(Agent)磁盘使用率等为细粒度(分钟级)监控指标。
创建告警规则
- 登录管理控制台。
- 在管理控制台左上角选择区域和项目。
- 单击“服务列表 > 云监控服务”。
- 单击页面左侧的“主机监控 > 弹性云服务器”,进入主机监控页面。
- 单击弹性云服务器所在栏右侧的“更多”按钮,选择“创建告警规则”。
- 在“创建告警规则”界面,已选定监控对象,触发规则选择“自定义创建”后配置告警策略。
图1 创建告警规则
表1 告警策略说明 参数
示例
说明
指标名称
告警策略1:云服务器 > (Agent)CPU使用率
告警策略2:云服务器 > (Agent)内存使用率
告警策略3:云服务器 - 挂载点 > (Agent)磁盘使用率
选择触发告警的指标
指标值类型
平均值 > 1小时
监控的指标值类型。分为原始值、平均值、最大值、最小值、方差值和求和值6种。
连续触发次数
连续三次
当告警连续多少次被触发时,发送告警信息。
比较关系
>=
比较检测指标值和阈值的关系。
阈值
重要80%、紧急90%
设置告警触发的阈值和单位。
告警频率
每1天告警一次
当告警产生时,告警以特定的频率重复通知。
- 根据界面提示,配置告警通知参数。更多告警通知参数请参考创建告警规则和通知。
表2 主机监控告警通知配置说明 参数
示例
说明
发送通知
开启
当触发设置的告警条件时,是否发送告警通知。
通知方式
主题订阅
选择告警通知方式
通知对象
云账号联系人
- 当通知方式选择主题订阅时,需要选择发送告警通知的对象。
- 当通知对象选择云账号联系人时,会发送告警通知到注册时的手机和邮箱。
生效时间
00:00-23:59
- 当通知方式选择主题订阅时,需要设置生效时间。
- 系统仅在生效时间内发送告警通知消息。
触发条件
依次勾选出现告警、恢复正常
当通知方式选择通知组或者主题订阅时,可以选择“出现告警”、“恢复正常”两种状态,作为触发告警通知的条件。