链接复制成功!
处理事件单
事件单接收后,相关责任人需严格遵循标准化流程推进全流程处置,确保响应及时、处理规范、结果可控。责任人首先需完成受理环节,快速核验单据信息完整性(含事件描述、影响范围、紧急程度等),明确受理状态并同步反馈发起方;随后进入核心处理环节,结合事件类型制定针对性解决方案,准确推进问题排查、资源协调、措施实施等操作,全程做好过程记录;处理完成后,需开展验证环节,通过实地核查、数据校验或发起方确认等方式,确保问题彻底解决,满足预期要求。整个流程以“闭环管理”为核心,规范操作、高效响应,保障业务运营稳定有序,提升问题处置质效与相关方满意度。
转发事件单
事件单处理过程发现该事件属于其他应用,或运维专家处理,可转发事件单给对应的责任人。
- 登录云运维中心。
- 在左侧导航栏选择“故障管理 > 事件管理”。
- 在“待处理的”页签,选择需要处理的事件单,单击事件标题,进入事件详情页面。
- 单击右上方“转发责任人”。
- 设置“转发责任人”相关信息。图2 转发责任人

- 单击“确定”,完成事件转发。
转发成功后,事件单责任人将变更为转发后的用户。
驳回事件单
事件单创建后,若事件不合理或其他原因事件处理人可驳回事件单,驳回后事件单创建人可重新修改提交或闭环。
- 登录云运维中心。
- 在左侧导航栏选择“故障管理 > 事件管理”。
- 在“待处理的”页签,选择需要处理的事件单,单击事件单标题,进入事件详情页面。
- 单击右上方“驳回”。图3 驳回事件单

- 填写驳回原因,单击“确定”。事件单状态将变更为“被驳回”。图4 填写事件原因

受理事件单
事件单创建后,事件单责任人分析事件实际情况,若属实则事件单责任人受理事件单并进行后续处理,完成事件单的闭环。
- 登录云运维中心。
- 在左侧导航栏选择“故障管理 > 事件管理”。
- 在“待处理的”页签,选择需要处理的事件单,单击事件标题,进入事件详情页面。
- 单击右上方“受理”,完成事件受理。
事件单状态由“未受理”变更为“已受理”。
关闭事件单
事件单被驳回后,事件提单人再次确认驳回原因,如不再需要继续跟踪,可关闭事件单。
- 登录云运维中心。
- 在左侧导航栏选择“故障管理 > 事件管理”。
- 在“待处理的”页签,选择需要处理的事件单,单击事件标题,进入事件详情页面。
- 单击右上方“关闭”,即可关闭事件单。
事件状态由“被驳回”变更为“客户已关闭”。
重新开启事件单
事件单被驳回后,事件提单人再次确认该故障需要提交,可以修改事件单内容后重新提交。
- 登录云运维中心。
- 在左侧导航栏选择“故障管理 > 事件管理”。
- 在“待处理的”页签,选择需要处理的事件单,单击事件标题,进入事件详情页面。
- 单击右上方“重新开启”。
- 设置“修改事件单”。
表2 修改事件单参数说明 参数
说明
事件名称
根据命名规则,自定义事件的名称。
事件描述
对事件进行描述。
上传附件
单击“添加文件”上传事件相关附件。
支持最多上传10个文件,支持文件类型:jpg、png、docx、txt、pdf,单个文件大小不能超过10MB。
事件级别
可选项“P1”、“P2”、“P3”、“P4”、“P5”。
- P1:核心业务功能不可用,影响所有客户。
- P2:核心业务功能受损,影响部分客户,客户核心业务受影响。
- P3:非核心业务功能异常报错,影响部分客户业务。
- P4:非核心业务功能异常报障,业务时延增大、性能下降,客户体验下降。
- P5:非系统业务异常,属于客户咨询、请求类问题。
事件类别
可选参数。在下拉列表选择事件的类别。
事件归属
可选参数。在下拉框中选择事件的归属。
- 告警发现
- 客户报障
- 主动运维
- 其他
区域
可选参数。默认“不涉及”。在下拉列表选择事件发生的区域。
企业项目
在下拉列表中选择企业项目。
故障发生时间
请填写故障发生的时间。
故障应用
在下拉列表选择事件涉及的故障应用。
业务是否中断
可选项“是”、“否”。
责任人
- 单击“确定”,完成事件单重新开启。
事件状态由“被驳回”变更为“未受理”。
事件单升降级
如果事件单在处理过程发现事件等级与实际情况不符,需修改级别,可以通过事件单升降级操作进行。
注意:事件只有在受理后才能修改级别。事件级别降级可以增加审批流程,详细操作请参考事件审批,设置后满足条件的事件降级申请需要审批人审核通过或驳回后才可以完成事件单降级流程。
为事件单添加备注
事件单处理过程,若存在事件单需要添加额外的备注信息,可使用添加备注的功能。
注意:事件受理后才能添加备注。
- 登录云运维中心。
- 在左侧导航栏选择“故障管理 > 事件管理”。
- 在“待处理的”页签,选择需要处理的事件单,单击事件标题,进入事件详情页面。
- 单击右上方“... > 添加备注”。
- 在“添加备注”页面填写事件的备注信息。
- 单击“确定”,完成事件备注添加。
应用诊断
当事件创建后,您可以通过应用诊断(全链路诊断)功能快速定位故障根因。用户通过应用诊断可以查看应用层、组件层、资源层的关系拓扑,基于资源和应用告警的异常数据,并提供资源核心指标查看与实例诊断能力。
使用应用诊断需满足以下前提条件:
- 确保已接入CES监控,请到集成管理进行配置。
- 已创建事件单。
- 如果需要展示CCE集群中的负载,pod信息,需要在CCE中对负载进行标签配置(每个分组只能添加一个CCE集群资源,否则不展示负载等信息)。 图5 配置CCE负载标签

应用诊断操作请参考以下步骤:
- 登录云运维中心。
- 在左侧导航栏选择“故障管理 > 事件管理”。
- 单击上方“全部事件单”。
- 选择需要诊断的事件单,单击事件标题,进入事件详情页面。
- 单击上方“应用诊断”。
- 单击时间框,设置故障时间。
时间框输入的时间为“结束时间”,“起始时间”为“结束时间”向前1小时。选择时间后,应用拓扑大屏展示所选时间段内应用和子应用的告警数量,右侧详情页展示应用故障详情。
- (可选)勾选“自动刷新”,自动刷新下拉列表选择刷新频率。
勾选“自动刷新”后,“结束时间”按照刷新频率自动刷新到系统当前时间。
- (可选)若应用有子应用,单击子应用。
应用拓扑大屏展示该子应用下的所有组件,右侧详情页展示子应用故障详情。支持在拓扑大屏切换查看其它子应用。
- 单击应用或子应用下组件。
应用拓扑大屏展示该组件下的所有资源,右侧详情页展示组件故障详情。支持在拓扑大屏切换查看其它组件。支持核心云服务的指标展示,如果在应用管理中有关联APM,也可以查看链路相关指标。
- 单击应用拓扑右侧“告警”。
查看应用告警,列表展示告警产生时间范围在右侧时间轴内的告警。支持选择左边拓扑对象后,自动筛选选择对象的告警信息。
- 单击应用拓扑右侧“变更”。
查看应用变更,列表展示变更时间范围在右侧时间轴内的变更。
- 单击应用拓扑右侧“故障诊断”。
查看资源的故障诊断数据,可以对应用的DCS、RDS、DMS、ECS、ELB资源进行诊断。支持选择左边拓扑对象后,自动筛选选择对象的诊断信息。
未创建过诊断或创建新诊断,具体操作如下。
- 单击“创建诊断”。
- 选择资源类型和资源。
- 单击“确定”。
- 确认“《GuestOS诊断服务前端数据授权》”,单击“同意”。

只有故障诊断选择ECS时需要签署同意许可。
诊断完成后,单击诊断结果列表右侧“查看详情”,查看诊断报告。
执行响应预案
事件受理并定位故障原因后,可以通过处理事件功能快速执行应急预案、脚本或作业来处理故障,并在事件处理功能中记录事件详情。
事件来源为“告警”的事件可以在事件详情中查看关联的原始告警。
- 登录云运维中心。
- 在左侧导航栏选择“故障管理 > 事件管理”。
- 在“待处理的”页签,选择需要处理的事件单,单击事件标题,进入事件详情页面。
- 根据选择的响应预案,执行以下对应步骤。
- 若选择应急预案
- 若选择脚本
- 若选择作业
- 单击“确定”,完成响应预案执行。
启动WarRoom
- 登录云运维中心。
- 在左侧导航栏选择“故障管理 > 事件管理”。
- 在“待处理的”页签,选择需要处理的事件单,单击事件标题,进入事件详情页面。
- 单击右上方“启动WarRoom”。
- 设置“启动WarRoom”。
表4 启动WarRoom参数说明 参数
说明
WarRoom名称
默认为事件单名称,用户可以自定义名称。
WarRoom描述
对WarRoom进行描述。
WarRoom管理员
在下拉列表选择用户作为WarRoom管理员。
区域
可选参数。在下拉列表选择WarRoom区域。可以选择多个区域。
企业项目
在下拉列表中选择企业项目。
应用
在下拉列表选择影响应用。可以选择多个应用。
创建群组方式
可选项“企业微信”、“钉钉”、“飞书”。
请先在移动应用管理配置应用通知方式,选择后WarRoom拉起会将排班人员和参与者拉入对应的群组中。
通知方式
可选项“短信”、“企业微信”、“钉钉”、“飞书”和“电话”。
如需选择“企业微信”、“钉钉”、“飞书”请先在移动应用管理配置应用通知方式。
排班
按照已配置的排班场景和角色在下拉列表选择。配置排班详细操作请参考排班管理。
参与者
在下拉列表选择参与用户。可以选择多个用户。
- 单击“确定”,完成WarRoom启动。
记录事件处理详情
- 登录云运维中心。
- 在左侧导航栏选择“故障管理 >事件管理”。
- 在“待处理的”页签,选择需要处理的事件单,单击事件标题,进入事件详情页面。
- 单击右上方“事件处理”,记录事件处理详情。
表5 事件处理参数说明 参数
说明
事件类别
必填项,在下拉列表选择事件的类别。
业务是否中断
必填项,可选项“是”、“否”。
故障发生时间
请填写故障发生时间。
当“业务是否中断”选择“是”时为必填项。
定界完成时间
请填写问题/故障定位完成时间。
故障恢复时间
请填写故障恢复时间。
当“业务是否中断”选择“是”时为必填项。
出现原因
必填项,请填写事件产生原因。
解决方案
必填项,请填写事件解决方案。
添加文件
单击“添加文件”上传事件相关附件。
支持最多上传10个文件,支持文件类型:jpg、png、docx、txt、pdf,上传文件不能超过10MB。
- 单击“确定”,完成事件处理详情记录。
创建改进单
事件单受理过程发现该故障有产品、运维的改进事项,可创建改进单进行跟进处理。
注意:事件受理后才能创建改进单。
- 事件单被处理后,进入“已解决待验证”状态,已解决待验证状态下可进行验证事件操作,验证通过后事件单进入“已完成”状态,验证不通过后,重新进入“已受理”状态。
验证事件单
事件单处理完成后,通过故障是否恢复或达到预计效果,在验证关闭事件中填写验证结果,选择未解决可以驳回,驳回后需事件单处理人重新定位并处理该故障。
- 登录云运维中心。
- 在左侧导航栏选择“故障管理 > 事件管理”。
- 在“待处理的”页签,选择需要处理的事件单,单击事件标题,进入事件详情页面。
- 单击右上方“验证关闭”。
- 设置“验证关闭”信息。
表7 验证关闭参数说明 参数
说明
验证结论
可选项“已解决”、“未解决”。
选择“未解决”将会驳回事件,事件流程重新变为“待处理”。
说明
请填写事件相关说明。
- 单击“确定”,完成事件单验证的处理。
查看事件单历史记录
若需追溯事件单处理阶段中某个节点做了什么操作,可以查看事件单的历史记录,事件单历史记录包含事件单的整个处理过程。
- 登录云运维中心。
- 在左侧导航栏选择“故障管理 > 事件管理”。
- 单击上方“全部事件单”。
- 选择需要查看的事件单,单击事件单标题,进入事件详情页面,进入事件详情页面。
- 单击“事件历史”,切换至事件历史页签。
- 在事件历史页签中,您可查看事件单历史记录,追溯事件单处理过程。
相关文档
- 若需要配置自定义事件级别、类别、审批规则及故障复盘规则等功能,可参考基础配置-事件流程。
- 发生群体性故障或重大故障时,可以启动WarRoom进行协同处理,可参考通过WarRoom协同处理事件单。
- COC支持通过调用API接口实现创建事件、管理事件单、处理事件单等,详细请参考事件管理。



