更新时间:2024-07-16 GMT+08:00
分享

OPS07-03 支持事件管理

  • 风险等级

  • 关键策略

    事件(incidents)是需要干预的事情。当发生事故(incidents)时,通过流程来处理。如何与团队沟通活动的状态?谁负责响应处置?使用哪些工具来缓解该事件?这些都是流程中需要回答的问题,并需要获得可靠的响应过程。流程必须中心化,并且可供参与工作负载的任何人使用。如果没有wiki 或文档存储,可以使用源代码版本控制机制。

    优先通过自动化响应事件,避免占用业务交付和创新的时间。首先构建一个可重复的流程来缓解问题,然后关注自动缓解或解决根本问题以提升效率。

  • 华为云相关云服务和工具

    云监控服务 CES

    云运维中心 COC

相关文档