演练模板说明
本章节提供覆盖多场景的标准化演练模板库,包含应急处置、流程推演、预案实操等12类核心模板。
所有模板均基于行业最佳实践设计,具备结构完整性和内容可复用性:既包含演练背景、流程节点、角色分工等标准框架,又支持根据实际需求快速调整场景参数、风险要素及处置步骤。模板附填写指引与易错提示,帮助使用者快速完成从模板调用到个性化适配的全流程,实现 “即取即用、高效落地” 的演练筹备目标。
| 
        模板名称  | 
      
        模板描述  | 
      
        标签  | 
      
        等级  | 
      
        任务组名称  | 
      
        攻击场景  | 
     
|---|---|---|---|---|---|
| 
        跨AZ容灾  | 
      
        在容灾部署架构下,模拟单个可用区整个故障或网络异常的情况下,服务及依赖的中间件进行容灾切换的能力。  | 
      
        容灾  | 
      
        高级  | 
      
        跨AZ容灾  | 
      
        整机断网  | 
     
| 
        DCS AZ下电  | 
     |||||
| 
        初涉混沌演练  | 
      
        新手上路必备场景,体验混沌演练流程。  | 
      
        节点  | 
      
        初级  | 
      
        初涉混沌演练  | 
      
        小试牛刀  | 
     
| 
        系统资源占用高  | 
      
        通过指定系统资源的占用量,测试服务在“高压”场景下的表现情况,提前应对宿主机资源不足的场景。  | 
      
        节点  | 
      
        中级  | 
      
        磁盘加压  | 
      
        磁盘使用率加压  | 
     
| 
        内存加压  | 
      
        内存使用率加压  | 
     ||||
| 
        CPU加压  | 
      
        CPU使用率加压  | 
     ||||
| 
        Kubernetes应用HPA配置  | 
      
        云原生架构下, 自动弹性扩缩容是一个很重要的特性; 在有限的资源条件下, 模拟服务Pod资源内存占用短时间内增高后扩容和资源占用降低后的缩容。  | 
      
        容器和集群  | 
      
        高级  | 
      
        Kubernetes应用HPA配置  | 
      
        Pod内存加压  | 
     
| 
        数据存储异常  | 
      
        服务的数据存储一般由服务所在的宿主机或中间件承载, 其中服务日志一般存储到宿主机磁盘上,服务数据一般存储到中间件如DDS上;同时模拟ECS磁盘IO高和数据库主备倒换的场景演练。  | 
      
        业务和数据  | 
      
        中级  | 
      
        数据存储异常  | 
      
        磁盘IO加压  | 
     
| 
        备节点强制升主  | 
     |||||
| 
        POD自动恢复与智能调度  | 
      
        在Kubernetes中,工作负载调度的基本单位是Pod。创建工作负载时,调度器会自动对工作负载中的Pod进行合理分配,例如将Pod分散到资源充足的节点上。  | 
      
        集群  | 
      
        中级  | 
      
        POD自动恢复与智能调度  | 
      
        内存使用率加压  | 
     
| 
        强制停止Pod实例  | 
     |||||
| 
        服务所在网络出现异常波动  | 
      
        模拟网络不稳定的情况下, 对业务的影响; 通过对业务所在宿主机的网卡注入网络延迟类的故障, 观测系统的应对情况。  | 
      
        网络  | 
      
        中级  | 
      
        服务所在网络出现异常波动  | 
      
        网络延迟  | 
     
| 
        微服务部署架构下环境过载  | 
      
        微服务是当前的主流架构, 带来的核心价值是能缩短业务上线周期及保障业务运行靠可靠, 但是也带来诸多挑战, 比如负责微服务架构下如何快速实现问题的定位和恢复,以下演练场景将模拟多个微服务所在节点同时出现过载情况。  | 
      
        容灾  | 
      
        中级  | 
      
        微服务部署架构下环境过载  | 
      
        CPU使用率加压  | 
     
| 
        网络连接耗尽  | 
     |||||
| 
        杀进程  | 
     |||||
| 
        服务器异常掉电  | 
      
        本混沌实验模拟服务器掉电后,模拟业务是否能快速恢复, 以及保证业务数据不丢失; 通过本演练实验实现节点掉电后, 用户使用提前准备好的“应急预案”实现快速恢复。  | 
      
        业务和数据  | 
      
        中级  | 
      
        服务器异常掉电  | 
      
        关机  | 
     
| 
        业务中间件缓存数据丢失  | 
      
        在大规模数据并发查询场景, 对数据查询效率要求较高, Redis成为互联网应用必不可少的服务之一, 在速度上对比传统数据库有很大优势, 但是可能存在数据一致性和可靠性等问题, 本混沌实验验证Redis数据清空后,业务是否正常。  | 
      
        容灾  | 
      
        中级  | 
      
        业务中间件缓存数据丢失  | 
      
        DCS实例重启  | 
     
| 
        宿主机配置文件误操作  | 
      
        运维直接对服务所在宿主机进行黑屏操作是高风险操作,如直接修改服务配置文件的权限, 可能就会导致业务进程对该文件不可读写,本混沌实验推荐使用“自定义脚本”的方式对宿主机上配置文件进行操作(修改权限或删除), 用户使用提前准备好的“应急预案”实现快速恢复。  | 
      
        业务和数据  | 
      
        中级  | 
      
        宿主机配置文件误操作  | 
      
        自定义脚本  | 
     
| 
        流量自动切换  | 
      
        Flexus应用服务器L实例是新一代开箱即用、面向中小企业和开发者打造的全新轻量级应用云服务器, 用户可以在L实例上部署数据库或服务应用,本演练模拟进程消失和数据库节点不通情况下的业务流量切换能力。  | 
      
        网络  | 
      
        高级  | 
      
        流量自动切换  | 
      
        杀进程  | 
     
| 
        网络中断  |