场景快速演练
演练执行计划配置完成后,可以对计划执行快速演练。
创建场景快速演练
- 进入运维中心工作台。
- 在顶部导航栏选择自有服务。
- 单击,选择 。
- 选择左侧导航栏的 。
- 单击“创建”,进入“创建场景快速演练”页面。
- 配置任务参数,参数说明如表1所示,配置完成后,单击“确定”。
表1 创建场景快速演练参数说明 参数类型
参数名称
参数说明
基本信息
任务名称
输入任务名称。
BCM类型
选择BCM类型。
支持选择“业务维度”或“横向维度”。
描述
输入任务描述信息。
演练对象
故障对象
选择故障对象。支持的演练对象有“弹性云服务器”、“NUWA容器”、“ELB&EIP”和“全链路压测任务”。
资源实例
选择实例资源。
不同的故障对象可选的资源不同,具体如下:
- 弹性云服务器:主机、集群、IP
- NUWA容器:AZ、CCECluster、Pod
- ELB&EIP:EIP
- 全链路压测任务:全链路压测任务
故障指标
稳态指标
在下拉框中选择稳态指标,可以选择单个或多个指标项,下拉框中的指标为在ServiceInsight中已创建并启用的巡检项。
如需得到故障注入主机的监控数据,需要在创建巡检项时设置维度过滤和维度分组(选择server_ip,然后输入主机IP);要获取集群、机房等的监控数据可以选择相应的维度过滤和维度分组。
观测指标
在下拉框中选择观测指标,可以选择单个或多个指标项,下拉框中的指标为在ServiceInsight中已创建并启用的巡检项。
如需得到故障注入主机的监控数据,需要在创建巡检项时设置维度过滤和维度分组(选择server_ip,然后输入主机IP);要获取集群、机房等的监控数据可以选择相应的维度过滤和维度分组。
故障指标
在下拉框中选择故障指标,可以选择单个或多个指标项,下拉框中的指标为在ServiceInsight中已创建并启用的巡检项。
如需得到故障注入主机的监控数据,需要在创建巡检项时设置维度过滤和维度分组(选择server_ip,然后输入主机IP);要获取集群、机房等的监控数据可以选择相应的维度过滤和维度分组。
故障模式
关联的故障场景
创建故障模式时需要选择关联的故障场景(演练方案的故障场景)。
故障设置
创建故障模式时在故障设置下拉框里选择要演练的故障模式。
操作
-
执行演练任务
执行演练任务前需要先设置执行机。
- 进入运维中心工作台。
- 在顶部导航栏选择自有服务。
- 单击,选择 。
- 选择左侧导航栏的 。
- 在演练任务列表,单击已创建的演练任务所在行“操作”列的“执行”。
- 任务执行之后,可以单击“执行历史”进入“执行历史”页面查看任务执行情况,也可以更改故障模式关联的场景,查看运行日志。
- 如需批量执行,可勾选待执行任务,单击“批量执行”。
查看演练监控
- 进入运维中心工作台。
- 在顶部导航栏选择自有服务。
- 单击,选择 。
- 选择左侧导航栏的 。
- 在演练任务列表,单击已执行的演练任务所在行“操作”列的“更多 > 演练监控”。
- 在“演练监控”页面查看监控详情。演练监控展示快速演练任务中关联的巡检项的指标监控图表、故障模式执行情况以及注入主机,单击主机IP可以查看运行日志。
编写演练报告
- 进入运维中心工作台。
- 在顶部导航栏选择自有服务。
- 单击,选择 。
- 选择左侧导航栏的 。
- 在演练任务列表,单击已执行的演练任务所在行“操作”列的“更多 > 演练报告”。
- 在“演练报告”页面编辑演练报告内容。
- 演练概述:演练报告名称、演练是否通过、运维投入人力、研发投入人力、RPO、RTO、演练总结。
- 应急预案:可以单击应急预案文件名称下载附件。
- 故障注入方法:显示故障注入方法,不可编辑。
- 演练监控:展示关联的巡检项里多个指标的实时监控数据。
- 告警列表:展示演练过程中出现的告警内容。
- BCM问题列表:任务执行出现问题时可以创建BCM问题进行跟踪。
更多操作
您还可以进行以下操作。
操作名称 |
操作步骤 |
---|---|
查看演练任务详情 |
在演练任务列表,单击待查看的演练任务所在行“操作”列的“详情”。 |
编辑演练任务 |
在演练任务列表,单击待编辑的演练任务所在行“操作”列的“更多 > 编辑”。 |
删除演练任务 |
在演练任务列表,单击待删除的演练任务所在行“操作”列的“更多 > 删除”。
说明:
删除后的演练任务会显示在“已删除”页签。 |