更新时间:2022-06-23 GMT+08:00

弹性云服务器事件

弹性云服务器是作为一种可随时获取、弹性可扩展的计算服务器。在各业务中,弹性云服务器作核心基础,细微的性能变化,运行异常及自动恢复,都可能会引起云服务上的业务受到大幅震荡。

因此需使用弹性负载均衡将访问流量根据转发策略分发到后端多台弹性云服务器,通过流量分发扩展应用系统对外的服务能力,通过消除单点故障提升应用系统的可用性,并且使用云监控的事件监控功能对服务器运行异常及自动恢复进行监控,订阅事件告警同步进行业务处理。

表1 ECS重点事件

事件名称

事件说明

处理步骤

开始自动恢复

弹性云服务器所在的主机出现故障时,系统会自动将弹性云服务器迁移至正常的物理机,该过程会导致云服务器重启,并发送一个“开始自动恢复”的事件,当迁移完成后,并发送一个“结束自动恢复”的事件,表示已恢复正常。

当收到“开始自动恢复”时,说明已发生故障,该机器无法使用,需要考虑更换弹性云服务器,或考虑将流量导至其他机器。

结束自动恢复

当收到“结束自动恢复”时,说明该ECS已正常工作,可继续使用。

操作步骤

  1. 登录管理控制台。
  2. 在管理控制台左上角选择区域和项目。
  3. 单击“服务列表 > 云监控服务”。
  4. 单击页面左侧的“事件监控”,在事件监控页面,单击相页面右上角的创建告警规则,根据界面提示配置参数。

    事件名称分别配置“开始自动恢复”“结束自动恢复”,具体参数说明请参见创建告警规则

  5. 配置完成后,单击“立即创建”,完成创建告警规则。

    当ECS出现异常事件时,云监控会在第一时间通过消息通知服务实时告知资源异常,提醒您处理,以免因此造成业务损失。