演练模板说明
本章节提供覆盖多场景的标准化演练模板库,包含应急处置、流程推演、预案实操等12类核心模板。
所有模板均基于行业最佳实践设计,具备结构完整性和内容可复用性:既包含演练背景、流程节点、角色分工等标准框架,又支持根据实际需求快速调整场景参数、风险要素及处置步骤。模板附填写指引与易错提示,帮助使用者快速完成从模板调用到个性化适配的全流程,实现 “即取即用、高效落地” 的演练筹备目标。
模板名称 |
模板描述 |
标签 |
等级 |
任务组名称 |
攻击场景 |
---|---|---|---|---|---|
跨AZ容灾 |
在容灾部署架构下,模拟单个可用区整个故障或网络异常的情况下,服务及依赖的中间件进行容灾切换的能力。 |
容灾 |
高级 |
跨AZ容灾 |
整机断网 |
DCS AZ下电 |
|||||
初涉混沌演练 |
新手上路必备场景,体验混沌演练流程。 |
节点 |
初级 |
初涉混沌演练 |
小试牛刀 |
系统资源占用高 |
通过指定系统资源的占用量,测试服务在“高压”场景下的表现情况,提前应对宿主机资源不足的场景。 |
节点 |
中级 |
磁盘加压 |
磁盘使用率加压 |
内存加压 |
内存使用率加压 |
||||
CPU加压 |
CPU使用率加压 |
||||
Kubernetes应用HPA配置 |
云原生架构下, 自动弹性扩缩容是一个很重要的特性; 在有限的资源条件下, 模拟服务Pod资源内存占用短时间内增高后扩容和资源占用降低后的缩容。 |
容器和集群 |
高级 |
Kubernetes应用HPA配置 |
Pod内存加压 |
数据存储异常 |
服务的数据存储一般由服务所在的宿主机或中间件承载, 其中服务日志一般存储到宿主机磁盘上,服务数据一般存储到中间件如DDS上;同时模拟ECS磁盘IO高和数据库主备倒换的场景演练。 |
业务和数据 |
中级 |
数据存储异常 |
磁盘IO加压 |
备节点强制升主 |
|||||
POD自动恢复与智能调度 |
在Kubernetes中,工作负载调度的基本单位是Pod。创建工作负载时,调度器会自动对工作负载中的Pod进行合理分配,例如将Pod分散到资源充足的节点上。 |
集群 |
中级 |
POD自动恢复与智能调度 |
内存使用率加压 |
强制停止Pod实例 |
|||||
服务所在网络出现异常波动 |
模拟网络不稳定的情况下, 对业务的影响; 通过对业务所在宿主机的网卡注入网络延迟类的故障, 观测系统的应对情况。 |
网络 |
中级 |
服务所在网络出现异常波动 |
网络延迟 |
微服务部署架构下环境过载 |
微服务是当前的主流架构, 带来的核心价值是能缩短业务上线周期及保障业务运行靠可靠, 但是也带来诸多挑战, 比如负责微服务架构下如何快速实现问题的定位和恢复,以下演练场景将模拟多个微服务所在节点同时出现过载情况。 |
容灾 |
中级 |
微服务部署架构下环境过载 |
CPU使用率加压 |
网络连接耗尽 |
|||||
杀进程 |
|||||
服务器异常掉电 |
本混沌实验模拟服务器掉电后,模拟业务是否能快速恢复, 以及保证业务数据不丢失; 通过本演练实验实现节点掉电后, 用户使用提前准备好的“应急预案”实现快速恢复。 |
业务和数据 |
中级 |
服务器异常掉电 |
关机 |
业务中间件缓存数据丢失 |
在大规模数据并发查询场景, 对数据查询效率要求较高, Redis成为互联网应用必不可少的服务之一, 在速度上对比传统数据库有很大优势, 但是可能存在数据一致性和可靠性等问题, 本混沌实验验证Redis数据清空后,业务是否正常。 |
容灾 |
中级 |
业务中间件缓存数据丢失 |
DCS实例重启 |
宿主机配置文件误操作 |
运维直接对服务所在宿主机进行黑屏操作是高风险操作,如直接修改服务配置文件的权限, 可能就会导致业务进程对该文件不可读写,本混沌实验推荐使用“自定义脚本”的方式对宿主机上配置文件进行操作(修改权限或删除), 用户使用提前准备好的“应急预案”实现快速恢复。 |
业务和数据 |
中级 |
宿主机配置文件误操作 |
自定义脚本 |
流量自动切换 |
Flexus应用服务器L实例是新一代开箱即用、面向中小企业和开发者打造的全新轻量级应用云服务器, 用户可以在L实例上部署数据库或服务应用,本演练模拟进程消失和数据库节点不通情况下的业务流量切换能力。 |
网络 |
高级 |
流量自动切换 |
杀进程 |
网络中断 |