云运维中心 COC
云运维中心 COC
链接复制成功!
概述
在发生群体性故障或重大故障时,为快速恢复业务正常运行,支撑运维、研发、运营联合作战,保障业务快速恢复而组建的会议。可通过WarRoom添加故障恢复成员及时响应预案、通过发送故障进展及时知会关注故障的人员、通过应用诊断、响应预案等辅助应用快速恢复。
若需拉起WarRoom群组,需在移动应用管理接入钉钉、企业微信或飞书。
处理流程
Warroom处理流程如下:
- 启动Warroom:在事件管理处理事件页面启动WarRoom。
- 故障定界和恢复:分析故障影响范围,恢复所有受影响应用。
若分析还有其他应用受影响,使用新增影响应用增加。
- 故障已恢复:检查故障处理结果和应用状态。
- 关闭WarRoom:确认故障已闭环,需要关闭WarRoom。
注意:填写修改故障信息中所有必填的故障信息才可以关闭WarRoom。
另外:
- 故障处理过程中如果需要增加相关成员并拉入群组,请参考与会成员操作。
- 故障处理过程中如果需要发布通告将故障处理进展及时同步给相关人员,请参考进展通告操作。
- 故障处理过程中如果识别到一些产品、运维或管理改进事项,可以创建改进单,并通过改进管理处理。
前提条件
需要有正在处理的事件单,在事件处理页面启动WarRoom。
父主题: WarRoom