更新时间:2025-08-08 GMT+08:00

演练模板说明

本章节提供覆盖多场景的标准化演练模板库,包含应急处置、流程推演、预案实操等12类核心模板。

所有模板均基于行业最佳实践设计,具备结构完整性和内容可复用性:既包含演练背景、流程节点、角色分工等标准框架,又支持根据实际需求快速调整场景参数、风险要素及处置步骤。模板附填写指引与易错提示,帮助使用者快速完成从模板调用到个性化适配的全流程,实现 “即取即用、高效落地” 的演练筹备目标。

表1 演练模板说明

模板名称

模板描述

标签

等级

任务组名称

攻击场景

跨AZ容灾

在容灾部署架构下,模拟单个可用区整个故障或网络异常的情况下,服务及依赖的中间件进行容灾切换的能力。

容灾

高级

跨AZ容灾

整机断网

DCS AZ下电

初涉混沌演练

新手上路必备场景,体验混沌演练流程。

节点

初级

初涉混沌演练

小试牛刀

系统资源占用高

通过指定系统资源的占用量,测试服务在“高压”场景下的表现情况,提前应对宿主机资源不足的场景。

节点

中级

磁盘加压

磁盘使用率加压

内存加压

内存使用率加压

CPU加压

CPU使用率加压

Kubernetes应用HPA配置

云原生架构下, 自动弹性扩缩容是一个很重要的特性; 在有限的资源条件下, 模拟服务Pod资源内存占用短时间内增高后扩容和资源占用降低后的缩容。

容器和集群

高级

Kubernetes应用HPA配置

Pod内存加压

数据存储异常

服务的数据存储一般由服务所在的宿主机或中间件承载, 其中服务日志一般存储到宿主机磁盘上,服务数据一般存储到中间件如DDS上;同时模拟ECS磁盘IO高和数据库主备倒换的场景演练。

业务和数据

中级

数据存储异常

磁盘IO加压

备节点强制升主

POD自动恢复与智能调度

在Kubernetes中,工作负载调度的基本单位是Pod。创建工作负载时,调度器会自动对工作负载中的Pod进行合理分配,例如将Pod分散到资源充足的节点上。

集群

中级

POD自动恢复与智能调度

内存使用率加压

强制停止Pod实例

服务所在网络出现异常波动

模拟网络不稳定的情况下, 对业务的影响; 通过对业务所在宿主机的网卡注入网络延迟类的故障, 观测系统的应对情况。

网络

中级

服务所在网络出现异常波动

网络延迟

微服务部署架构下环境过载

微服务是当前的主流架构, 带来的核心价值是能缩短业务上线周期及保障业务运行靠可靠, 但是也带来诸多挑战, 比如负责微服务架构下如何快速实现问题的定位和恢复,以下演练场景将模拟多个微服务所在节点同时出现过载情况。

容灾

中级

微服务部署架构下环境过载

CPU使用率加压

网络连接耗尽

杀进程

服务器异常掉电

本混沌实验模拟服务器掉电后,模拟业务是否能快速恢复, 以及保证业务数据不丢失; 通过本演练实验实现节点掉电后, 用户使用提前准备好的“应急预案”实现快速恢复。

业务和数据

中级

服务器异常掉电

关机

业务中间件缓存数据丢失

在大规模数据并发查询场景, 对数据查询效率要求较高, Redis成为互联网应用必不可少的服务之一, 在速度上对比传统数据库有很大优势, 但是可能存在数据一致性和可靠性等问题, 本混沌实验验证Redis数据清空后,业务是否正常。

容灾

中级

业务中间件缓存数据丢失

DCS实例重启

宿主机配置文件误操作

运维直接对服务所在宿主机进行黑屏操作是高风险操作,如直接修改服务配置文件的权限, 可能就会导致业务进程对该文件不可读写,本混沌实验推荐使用“自定义脚本”的方式对宿主机上配置文件进行操作(修改权限或删除), 用户使用提前准备好的“应急预案”实现快速恢复。

业务和数据

中级

宿主机配置文件误操作

自定义脚本

流量自动切换

Flexus应用服务器L实例是新一代开箱即用、面向中小企业和开发者打造的全新轻量级应用云服务器, 用户可以在L实例上部署数据库或服务应用,本演练模拟进程消失和数据库节点不通情况下的业务流量切换能力。

网络

高级

流量自动切换

杀进程

网络中断