快捷混沌演练
操作场景
云运维中心(Cloud Operations Center,简称COC)为用户提供安全、高效的一站式智能运维平台,满足客户集中运维诉求。云运维中心的混沌演练功能支持用户配置演练模板、攻击模板,基于模板对物理机、虚拟机或CCE容器等进行故障演练。支持故障模式管理功能。您可以通过该功能对目标实例进行故障演练。
本章节介绍如何通过云运维中心操作一台弹性云服务器ECS进行CPU使用率加压的故障演练。
操作流程
操作步骤 |
说明 |
---|---|
注册华为账号并实名认证,开通云运维中心。 |
|
获取当前用户所属的所有Region下资源数据并同步至云运维中心。 |
|
管理应用与云资源的关系,并为后续资源的监控、自动化运维等,提供统一、及时的资源环境管理服务。 |
|
针对资源预设演练方案,支持多攻击任务自由编排的故障注入组合。 |
|
按照已经创建的演练任务,自动化的故障注入。 |
准备工作
- 注册账号并实名认证。
在使用云运维中心之前,请先注册华为账号并开通华为云,然后实名认证。
如果您已开通华为云并进行实名认证,请忽略此步骤。
- 开通云运维中心。
新用户首次登录云运维中心 ,请先开通云运维中心。
如果您已开通云运维中心,请忽略此步骤。
步骤二:创建应用
- 在左侧导航栏选择“资源管理 > 应用资源管理”,进入应用资源管理页面。
- 单击“应用管理”页签,进入应用管理页面。
- 单击“创建应用”,进入创建应用页面。
- 设置“应用结构类型”。
图2 “应用结构类型”参数配置
表1 “应用结构类型”参数说明 参数
示例
说明
应用结构类型
轻量级应用
请根据应用结构的复杂类型选择。
- 设置“应用结构配置”。
图3 “应用结构配置”参数配置
表2 “应用结构配置”参数说明 参数
示例
说明
应用名称
test-application
根据命名规则,自定义应用的名称。填写后单击“保存”,进入新建组件页面。
组件名称
test-component
根据命名规则,自定义组件的名称。填写后单击“保存”,进入新建分组页面。
分组名称
test-group
根据命名规则,自定义分组的名称。
云厂商
华为云
请选择目标实例所在云厂商。
区域
华北-乌兰察布-二零三
请选择目标实例所在可用区。
资源关联方式
手动关联
请选择资源关联方式。
关联资源
-
请选择需要混沌演练的目标实例。选择后单击“保存”。
- 单击“创建”,完成应用创建。
步骤三:创建演练任务
- 在左侧导航栏选择“韧性中心 > 混沌演练”页面,进入混沌演练页面。
- 单击“演练任务”页签,进入演练任务页面。
- 单击“创建演练任务”,进入创建演练任务页面。
- 设置“基础信息”。
图4 “基础信息”参数配置
表3 “基础信息”参数说明 参数
示例
说明
演练任务名称
test-drill
根据命名规则,自定义演练任务的名称。
期望恢复时长(分钟)
3
从故障发生到故障恢复的预期时间
- 单击“添加一个新的攻击任务,还可创建5个攻击任务”,进入添加攻击新的攻击任务页面。
- 设置“添加新的攻击任务”,设置完成后单击“下一步”,进入选择攻击场景页面。
图5 “添加新的攻击任务”参数配置
表4 “添加新的攻击任务”参数说明 参数
示例
说明
攻击目标来源
弹性云服务器(ECS)
请选择目标实例的来源。
攻击任务名称
test-attacktask
根据命名规则,自定义攻击任务的名称。
攻击目标
-
请选择目标实例。
- 设置“选择攻击场景”,设置完成后单击“下一步”。
图6 “选择攻击场景”参数配置
表5 “选择攻击场景”参数说明 参数
示例
说明
攻击类型
主机资源
根据攻击场景的类型区分。
攻击场景
CPU使用率加压
根据命名规则,自定义攻击任务的名称。
攻击参数
CPU使用率(百分比):80
故障持续时长(秒):60
根据不同的攻击场景,配置相应的攻击参数。
- “监控任务配置”本次不做配置,单击“完成”。
- 单击“完成配置”,完成演练任务创建。
步骤四:启动演练
- 在左侧导航栏选择“韧性中心 > 混沌演练”页面,进入混沌演练页面。
- 单击“演练任务”页签,进入演练任务页面。
- 找到步骤三中创建的演练任务,单击操作列“启动演练”。
图7 启动演练
- 了解风险提示后,单击“确认”,进入演练记录详情页面。
- 支持查看攻击进度和攻击详情。等待演练完成,单击“创建演练报告”支持创建演练报告。
图8 演练记录详情