演练任务
操作场景
管理混沌演练任务,查看演练记录。
创建演练任务
- 登录COC。
- 在左侧菜单栏选择“韧性中心 > 混沌演练”页面,选择“演练任务”页签。
- 单击“创建演练任务”,进入创建演练任务页面,也可以通过演练规划接单功能进入创建演练任务页面,具体步骤可以参考演练规划章节。
图1 创建演练任务
- 填写演练任务基本信息,包括演练任务名称和期望恢复时长,单位为分钟。
期望恢复时长:在故障注入之后,应用自恢复或在执行应急预案时恢复到正常状态的期望时间,该时间不会对演练任务产生影响。图2 演练任务基本信息
- 选择攻击任务,默认有1个攻击任务组,单击“添加新的任务组”可添加新的任务组,单击“添加一个新的攻击任务”进入“添加新的攻击任务”界面。
图3 选择攻击任务
1.任务组间的任务为串行执行,任务组内的任务为并行执行。
2.当前不支持一个任务组内对同一个资源的多次故障注入。
- 添加新的攻击任务,可以选择新创建攻击任务或者选择已有的任务。之前没有创建过攻击任务,需要新建攻击任务,之前创建过攻击任务,可以选择已有。
- 创建攻击任务分为三步,选择攻击目标、选择攻击场景、监控任务配置(可选),其中,不同的攻击目标对应不同的攻击场景。先填写攻击任务名称,攻击目标来源分为弹性云服务器 (ECS)、云容器引擎 (CCE)、云数据库(RDS)、分布式缓存服务(DCS)和文档数据库服务(DDS),单击“下一步”(以ECS为攻击目标为例,根据需要攻击的应用,选择该应用下的ECS实例)。
图4 选择攻击目标为弹性云服务器 (ECS)
- 选择攻击场景并填写场景的攻击参数,单击“完成”即可。场景包括主机资源类、主机进程类、主机网络类。
图5 弹性云服务器 (ECS)攻击场景
- 可选配置演练监控任务指标,演练监控指标,分为“稳定指标”和“监控指标”。“稳态指标”是在演练过程中用于衡量应用是否正常运行的关键指标,若在演练之前或演练过程中,“稳态指标”不在对应的上下限区间内,演练将自动停止。“监控指标”是在演练过程中对一些业务指标进行监控,您根据这些监控数据判断演练风险和应用是否正常运行。 通过指定攻击目标中的主机、监控的指标名称、指标的上下限区间值,配置监控任务。
图6 弹性云服务器(ECS)攻击场景演练监控配置
- 如果选择攻击目标来源为云容器引擎 (CCE),则需要选择应用、选择pods(依次选择集群、namespace、工作负载类型、工作负载),可以指定pod或者指定数量(指定数量时,将执行随机策略。如填写数量为10,则将随机取10个pod进行故障注入),单击“下一步”。
图7 选择攻击目标为云容器引擎 (CCE),指定pod
图8 选择攻击目标为云容器引擎 (CCE),指定数量
- 选择云容器引擎 (CCE)攻击场景并填写场景的攻击参数,单击“完成”即可。场景包括Pod资源类、Pod进程类、Pod网络类。
图9 云容器引擎 (CCE)攻击场景
- 如果选择攻击目标来源为云数据库(RDS),则选择指定的云数据库实例,单击“下一步”。
图10 选择攻击目标为云数据库(RDS)
- 选择云数据库(RDS)攻击场景并填写场景的攻击参数,单击“完成”即可。
图11 云数据库(RDS)攻击场景
- 如果选择攻击目标来源为分布式缓存服务(DCS),则选择指定的分布式缓存服务实例,单击“下一步”。
图12 选择攻击目标为分布式缓存服务(DCS)
- 选择分布式缓存服务(DCS)攻击场景并填写场景的攻击参数,单击“完成”即可。
图13 分布式缓存服务(DCS)攻击场景
- 如果选择攻击目标来源为文档数据库服务(DDS),则选择指定的文档数据库服务实例,单击“下一步”。
图14 选择攻击目标为文档数据库服务(DDS)
- 选择文档数据库服务(DDS)攻击场景,单击“完成”即可。
图15 文档数据库服务(DDS)攻击场景
- 如果添加新的攻击任务方式为选择已有,则在下方攻击任务列表中选择之前创建的攻击任务,单击“确认”。
图16 选择已有攻击任务
- 单击“完成配置”,即可完成演练任务的创建。
图17 完成配置
编辑演练任务
编辑已经创建的演练任务,演练任务已生成演练记录,不可操作编辑。
- 登录COC。
- 在左侧菜单栏选择“韧性中心 > 混沌演练”页面,选择“演练任务”页签,查看演练任务列表。
- 在演练任务列表的“操作”列,选择“更多 > 编辑”,可修改演练任务的基本信息。
图18 单击“编辑”
- 编辑攻击任务,支持添加新的任务组,添加一个新的攻击任务,删除已有的攻击任务,已经创建的单个攻击任务不支持修改。
- 单击“完成配置”,即可完成演练任务的编辑。
图19 编辑演练任务
删除演练任务
删除已经创建的演练任务,该演练任务已生成演练记录,不可操作删除,已有演练规划关联该演练任务,不可操作删除。
- 登录COC。
- 在左侧菜单栏选择“韧性中心 > 混沌演练”页面,选择“演练任务”页签,查看演练任务列表。
- 在演练任务列表的“操作”列,单击“更多 > 删除”。
图20 演练任务列表
- 在弹框中单击“确认”,即可删除演练任务。
图21 删除演练任务
启动演练
对已经创建的演练任务,启动演练。
- 登录COC。
- 在左侧菜单栏选择“韧性中心 > 混沌演练”页面,选择“演练任务”页签,查看演练任务列表。
- 在演练任务列表的“操作”列,单击“启动演练”,进入“演练记录详情”页面。
图22 启动演练
- 在“演练记录详情”页面可以查看攻击进度,包括安装探针、执行演练、清理环境三个步骤,系统会自动执行。执行时间视武器的攻击时间而定。
图23 攻击进度
图24 攻击完成
- 演练执行过程中,可单击“终止演练”来结束演练,单击“重试”来重试当前步骤或者单击“跳过”来跳过当前步骤执行下一个步骤。如果在创建攻击任务时配置了演练监控任务,单击“监控”即可查看攻击目标的实时监控数据。
图25 演练监控数据
- 单击“攻击详情”,可查看攻击详情。
图26 攻击详情
查看演练记录
查看演练任务的演练记录。如果当前演练任务没有被演练过,则不能查看演练记录。
- 登录COC。
- 在左侧菜单栏选择“韧性中心 > 混沌演练”页面,选择“演练任务”页签,查看演练任务列表。
- 找到需要查看的演练任务,单击“操作”列“演练记录”,进入“演练记录”页面。
图27 演练任务列表
- 演练记录页面上方会展示演练任务的基本信息,包括演练任务名称、演练任务ID、攻击详情、故障模式等。下方列表展示所有的演练记录信息,包括演练记录ID、执行状态、执行人、演练开始时间,演练结束时间等。
图28 演练记录
- 单击“进度查看”,进入“演练记录详情”页面,可以查看当前演练任务的攻击进度和攻击详情。
图29 攻击进度
- 单击右上角的“创建/查看演练报告”,进入“演练报告”页面,可以创建或查看演练报告,具体参考演练报告章节。
图30 演练报告