故障模式
故障模式是指应用在运行过程中可能出现的特定类型的问题或失效状态。构建丰富的故障模式库,制定相应的预防和恢复措施,有助于设计更加高可用的应用系统。通过识别潜在的故障,可以针对该故障进行日常演练,验证故障恢复措施和故障影响是否符合预期,为更好地应对各种挑战做好准备。
操作场景
您可以对应用可能发生的故障点进行分析,通过描述故障发生的条件、故障发生的现象、客户影响等字段建立故障模式,并将该故障模式应用于日常的混沌演练。
注意事项
确认故障模式所属的企业项目、所属应用、事件级别、场景分类是否正确。
操作步骤
- 登录COC。
- 在左侧菜单栏选择“韧性中心 > 混沌演练”页面,选择“风险管理 > 故障模式”页签,单击“创建故障模式库”。
图1 故障模式页面
- 参考表1 故障模式参数说明填写故障模式信息。
图2 创建故障模式
表1 故障模式参数说明 参数名
参数描述
故障模式名称
用户自定义故障模式名称
企业项目
故障模式资源所属的企业项目,默认为default
所属应用
演练目标所属的应用
事件级别评估
参考事件中心事件级别定义
来源
包括主动分析,已有故障
是否有应急预案
是或者否,默认为是
应急预案名称
下拉搜索选择对应的应急预案,如果没有,可以创建应急预案,具体参考应急预案章节
场景分类
故障属于哪种场景,包括冗余、容灾、过载、配置、依赖
发生条件
故障可能发生的条件
预计故障现象
故障发生时的业务现象
客户影响
故障造成的客户影响
- 选择是否有应急预案。如果选择是,请输入应急预案名称搜索,选择对应的应急预案,如果没有合适的应急预案 可以选择直接创建一个应急预案,单击“完成配置”即可创建故障模式。