链接复制成功!
故障复盘
操作场景
事件验证通过后,会根据故障复盘规则自动生成故障报告,在故障报告基础上对本次故障进行复盘,避免故障再次发生。故障复盘信息包含有故障现象、故障影响、故障处理过程、根因分析、解决方案,同类故障、改进措施等15种以上分析项。
系统默认P1/P2/P3/P4级别的事件和启动了WarRoom所有级别的事件需进行复盘,该规则可在故障复盘规则中修改。
故障复盘
- 登录云运维中心。
- 在左侧导航栏选择“故障管理 > 事件管理”。
- 单击“全部事件单”页签。
- 选择需要复盘的事件单,单击故障报告/状态列“故障报告”。
系统会将事件单的基本信息自动填充至复盘信息中,如故障现象,故障处理过程、故障原因等,并支持编辑。
- 单击右上方“编辑报告”。
- 设置“故障信息”。
表1 故障信息参数说明 参数
说明
报告标题
自定义故障报告的标题。
报告责任人
在下拉列表选择故障报告责任人。
故障现象
请填写故障的现象。
限制长度1-1000个字符。
影响客户
请填写受影响的客户。
限制长度1-1000个字符。
影响应用
请填写应用的影响描述。
支持添加和删除影响应用。
- 设置“处理过程”。
表2 处理过程参数说明 参数
说明
处理过程
请填写处理过程的时间和过程描述。
支持添加和删除处理过程。
- 设置“根因分析”。
表3 根因分析参数说明 参数
说明
根因分析
请填写故障的根因分析。
单击“添加文件”上传根因分析件相关附件。
支持最多上传10个文件,支持文件类型:jpg、png、docx、txt、pdf,上传文件不能超过10MB。
- 设置“监控告警”。
表4 监控告警参数说明 参数
说明
是否优先于客户发现
可选项“是”、“否”。
告警单号
支持添加和删除告警。
- 设置“解决方案”。
表5 解决方案参数说明 参数
说明
短期方案(故障如何恢复)
请填写故障的短期方案。
单击“添加文件”上传短期方案相关附件。
支持最多上传10个文件,支持文件类型:jpg、png、docx、txt、pdf,上传文件不能超过10MB。
长期方案(如何避免再次发生)
请填写故障的长期方案。
单击“添加文件”上传长期方案相关附件。
支持最多上传10个文件,支持文件类型:jpg、png、docx、txt、pdf,上传文件不能超过10MB。
应用韧性相关规划和分析
请填写应用韧性相关规划和分析。
单击“添加文件”上传应用韧性相关附件。
支持最多上传10个文件,支持文件类型:jpg、png、docx、txt、pdf,上传文件不能超过10MB。
- 设置“同类故障”。
表6 同类故障参数说明 参数
说明
是否有同类故障
可选项“是”、“否”。
事件单号
是否有同类故障选择是时必填。
支持添加和删除事件。
- 设置“改进措施”。
表7 改进措施参数说明 参数
说明
产品改进
请填写产品改进详情。
支持创建和删除产品改进类改进单。
运维改进
请填写运维改进详情。
支持创建和删除运维改进类改进单。
管理改进
请填写管理改进详情。
支持创建和删除管理改进类改进单。
- 单击"确定"。
- 设置“故障复盘进度”。
- 故障复盘进度:可选项“已复盘”、“复盘中”、“未复盘”。
- 单击“确定”。
完成故障复盘。