产品介绍
服务概述
确定性运维的概念首先是通过高质量的产品开发,严谨的运维流程和制度来降低故障的概率,我们要挑战零故障,同时也要有技术手段对可能发生的故障,将间隔、影响范围及故障恢复时间做到可防、可控、可治,我们要把云化带来的“不确定性”通过运维变成“确定性”。
基于华为云上SRE运维最佳实践提供确定性运维评估规划和设计服务,帮助客户构建确定性运维体系,实现运维变革。
场景名称 |
客户痛点 |
提供核心能力 |
客户收益 |
---|---|---|---|
场景1:标准化运维体系不完善 |
组织:无严格定义的流程角色和职责,依赖个人经验。 流程:无严格定义的流程和步骤,靠事件驱动,以及个人经验,缺乏计划性。 工具:无ITSM工具,无运维作业工具。 此场景客户运维管理体系欠缺,咨询侧重于构建完整的运维管理体系,帮助客户从基本运维进阶帮助客户开启标准化运维之路。 |
此场景客户运维管理体系欠缺,咨询侧重于构建完整的运维管理体系,帮助客户从基本运维进阶帮助客户开启标准化运维之路。 |
无序向有序演进向标准化进阶,标准化先行:从无序到最佳秩序,降低技能依赖,提高运维效率,降低运作成本,降低运维风险。 |
场景2:标准化维体系向SRE转型 |
组织:设置了常规运维管理和被动响应的岗位,80%以上的时间在被动处理运维需求和问题,与devops模式下应用业务上线速度和现网稳定性之间的冲突。 流程:开展主动运维活动,如:架构高可用、上线管理、混沌工程、风险清零等运维能力构建无流程和优秀实践的能力,能力构建缓慢。 工具:烟囱式的工具体系,无法满足业务端到端的告警、性能分析、效率低,运维自动化率低。 |
此场景下客户已构建了标准化能力,需要向SRE转型进阶,从组织、流程、工具和能力上帮助客户进行转型规划与设计,开启SRE转型之路。 |
流程管控向软件工程转型向SRE转型进阶,SLO提升,MTTR降低,提高客户业务可用性 从消防员到建筑师的演变,持续提升业务的高可用 通过软件工程,解决现网运维问题,减少琐事提升自动化、工具化率从而提高效率,降低人力投入。 |
场景3:迈向确定性运维 |
组织:客户的运维部门已进入SRE转型阶段,构建了架构高可用、自动化运维能力、上线管理能力确定性运维能力,但是事件并不完整,但是在研发部门未构建相应的运维组织和能力,运维组织和研发组织无法拉通管理,无法守护统一SLO。 流程:需要将运维部门的业务流程对比优秀实践进行优化和刷新,细化运维组织和研发组织的协同工作机制,并在公司层面进行发布,共同遵守。 工具:基础设施和应用未统一管理,端到端的应用的SLO、问题诊断等能力缺失。 |
客户运维组织已构建狭义SRE的能力,需要在研发团队深入开展广义SRE,打通确定性运维之路。 |
软件工程向可用性架构转型向确定性进阶,通过构建动态清零风控持续优化,重大故障率减少40%,数据运营让数据对业务产生价值,让数据驱动运维改进,构建确定性恢复运作机制,不断提升快速恢复能力,稳定可靠:质量运营、动态风控、混沌工程、AIOPS运作成熟,成为质量的守护者,确定性的发现时长、定界时长、恢复时长,运维的确定性能力应对不确定性挑战 |
场景4:运维数字化转型诊断 |
客户运维的复杂度和不确定性持续增高,业务部门对可用性诉求高,此时运维抓不准发展的方向,难以判断自身发展水平,缺乏可供参考的实践标杆和解决方案,找不到转型升级的方向和突破点。 |
此场景客户运维能力不足,咨询侧重于帮助客户诊断运维现状,识别各个领域的痛点和挑战,从运维组织、流程、工具、技术能力、衡量指标等角度提出优化策略。 |
借助SRE确定性运维与业界最佳实践,企业能够全面了解自身的数字化转型现状和关键的问题;建立确定性运维发展目标;构建体系化的运维优化策略。 |
服务内容
- 确定性运维规划
服务项
服务内容
适用场景
运维数字化转型诊断-中小型企业(基础版)-亚太俄罗斯拉美(不含巴西)
针对客户运维现状进行访谈调研,融合多领域标准、模型和行业SRE实践,有针对性的进行诊断,提出优化策略,输出调研报告和诊断报告。
主要针对客户IT部门人员50人以内,相关业务部门10个以内。客户运维的复杂度和不确定性持续增高,运维能力不能满足企业数字化转型越来越高的可用性要求,需要基础的诊断服务。
运维数字化转型诊断-中小型企业(专业版)-亚太俄罗斯拉美(不含巴西)
针对客户运维现状调研,进行成熟度评估,融合多领域标准、模型和行业SRE实践进行诊断,提出优化策略,输出调研报告、成熟度评估报告和诊断报告。
主要针对客户IT部门人员50人以内,相关业务部门10个以内。客户运维的复杂度和不确定性持续增高,运维能力不能满足企业数字化转型越来越高的可用性要求,需要专业的诊断服务。
确定性运维评估与规划-中型企业-亚太俄罗斯拉美(不含巴西)
针对客户运维现状进行访谈调研,为客户全面评估运维成熟度,差距分析改进建议;结合诊断分析结果输出整体规划与演进路标,为客户量身定制确定性运维体系。
主要针对客户IT部门人员20~50人以内,相关业务部门10个以内。客户运维体系无严格定义的流程角色和职责,依赖个人经验,靠事件驱动被动式运维,建设了部分烟囱式工具,整体效率不高。
确定性运维评估与规划-大型企业(基础必选)-亚太俄罗斯拉美(不含巴西)
针对客户运维现状进行访谈调研,为客户全面评估运维成熟度,差距分析改进建议;结合诊断分析结果输出整体规划与演进路标,为客户量身定制确定性运维体系。
主要针对客户IT部门人员超过50人,相关业务部门10个以内。客户运维体系无严格定义的流程角色和职责,依赖个人经验,靠事件驱动被动式运维,建设了部分烟囱式工具,整体效率不高。
运维数字化转型诊断-中小型企业(基础版)-欧洲非洲巴西中东
针对客户运维现状进行访谈调研,融合多领域标准、模型和行业SRE实践,有针对性的进行诊断,提出优化策略,输出调研报告和诊断报告。
主要针对客户IT部门人员50人以内,相关业务部门10个以内。客户运维的复杂度和不确定性持续增高,运维能力不能满足企业数字化转型越来越高的可用性要求,需要基础的诊断服务。
运维数字化转型诊断-中小型企业(专业版)-欧洲非洲巴西中东
针对客户运维现状调研,进行成熟度评估,融合多领域标准、模型和行业SRE实践进行诊断,提出优化策略,输出调研报告、成熟度评估报告和诊断报告。
主要针对客户IT部门人员50人以内,相关业务部门10个以内。客户运维的复杂度和不确定性持续增高,运维能力不能满足企业数字化转型越来越高的可用性要求,需要专业的诊断服务。
确定性运维评估与规划-中型企业(基础必选)-欧洲非洲巴西中东
针对客户运维现状进行访谈调研,为客户全面评估运维成熟度,差距分析改进建议;结合诊断分析结果输出整体规划与演进路标,为客户量身定制确定性运维体系。
主要针对客户IT部门人员20~50人以内,相关业务部门10个以内。客户运维体系无严格定义的流程角色和职责,依赖个人经验,靠事件驱动被动式运维,建设了部分烟囱式工具,整体效率不高。
确定性运维评估与规划-大型企业(基础必选)-欧洲非洲巴西中东
针对客户运维现状进行访谈调研,为客户全面评估运维成熟度,差距分析改进建议;结合诊断分析结果输出整体规划与演进路标,为客户量身定制确定性运维体系。
主要针对客户IT部门人员超过50人,相关业务部门10个以内。客户运维体系无严格定义的流程角色和职责,依赖个人经验,靠事件驱动被动式运维,建设了部分烟囱式工具,整体效率不高。
- 确定性运维设计
服务项
服务内容
适用场景
运维组织架构设计-(中型企业)-亚太俄罗斯拉美(不含巴西)
结合《现状调研与诊断分析报告》和《确定性运维整体规划与演进路标》帮助客户设计适合企业的组织架构和岗位职责,助力确定性运维能力的落地。
主要针对客户IT部门人员20~50人以内,相关业务部门10个以内,结合基础包输出的内容及客户诉求,需要先购买基础包再购买增量包。主要是帮助企业设计组织架构和岗位职责,优化组织和文化。
运维组织架构设计-(大型企业)-亚太俄罗斯拉美(不含巴西)
结合《现状调研与诊断分析报告》和《确定性运维整体规划与演进路标》帮助客户设计适合企业的组织架构和岗位职责,助力确定性运维能力的落地。
主要针对客户IT部门人员超过50人,相关业务部门10个以内,结合基础包输出的内容及客户诉求,需要先购买基础包再购买增量包。主要是帮助企业设计组织架构和岗位职责,优化组织和文化。
运维流程设计-(中型企业)-亚太俄罗斯拉美(不含巴西)
详细设计适合客户业务需要的七套运维流程和规范包含(变更管理、监控告警含Oncall管理、事件管理含WarRoom、回溯改进管理、问题管理、容量管理、交付转维)。
主要针对客户IT部门人员20~50人以内;相关业务部门10个以内,需要先购买基础包再购买增量包。帮助企业设计7套标准化运维流程和规范。
运维流程设计-(大型企业)-亚太俄罗斯拉美(不含巴西)
详细设计适合客户业务需要的七套运维流程和规范包含(变更管理、监控告警含Oncall管理、事件管理含WarRoom、回溯改进管理、问题管理、容量管理、交付转维)。
主要针对客户IT部门人员超过50人,相关业务部门10个以内,需要先购买基础包再购买增量包。帮助企业设计7套标准化运维流程和规范。
运维组织架构设计-(中型企业)-欧洲非洲巴西中东
结合《现状调研与诊断分析报告》和《确定性运维整体规划与演进路标》帮助客户设计适合企业的组织架构和岗位职责,助力确定性运维能力的落地。
主要针对客户IT部门人员20~50人以内,相关业务部门10个以内,结合基础包输出的内容及客户诉求,需要先购买基础包再购买增量包。主要是帮助企业设计组织架构和岗位职责,优化组织和文化。
运维组织架构设计-(大型企业)-欧洲非洲巴西中东
结合《现状调研与诊断分析报告》和《确定性运维整体规划与演进路标》帮助客户设计适合企业的组织架构和岗位职责,助力确定性运维能力的落地。
主要针对客户IT部门人员超过50人,相关业务部门10个以内,结合基础包输出的内容及客户诉求,需要先购买基础包再购买增量包。主要是帮助企业设计组织架构和岗位职责,优化组织和文化。
运维流程设计-(中型企业)-欧洲非洲巴西中东
详细设计适合客户业务需要的七套运维流程和规范包含(变更管理、监控告警含Oncall管理、事件管理含WarRoom、回溯改进管理、问题管理、容量管理、交付转维)。
主要针对客户IT部门人员20~50人以内;相关业务部门10个以内,需要先购买基础包再购买增量包。帮助企业设计7套标准化运维流程和规范。
运维流程设计-(大型企业)-欧洲非洲巴西中东
详细设计适合客户业务需要的七套运维流程和规范包含(变更管理、监控告警含Oncall管理、事件管理含WarRoom、回溯改进管理、问题管理、容量管理、交付转维)。
主要针对客户IT部门人员超过50人,相关业务部门10个以内,需要先购买基础包再购买增量包。帮助企业设计7套标准化运维流程和规范。
小型企业:客户IT部门人员1~20人以内(含集团,分公司,第三方IT团队);相关业务部门10个以内(含集团,子公司业务部门及其他相关方)
中型企业:客户IT部门人员20~50人以内(含集团,分公司,第三方IT团队);相关业务部门10个以内(含集团,子公司业务部门及其他相关方)
大型企业:客户IT部门人员超过50人(含集团,分公司,第三方IT团队);相关业务部门超过10个(含集团,子公司业务部门及其他相关方)
前提条件
- 客户应提前至少20个工作日申请该服务,以便华为评估客户需求及协调确定性运维咨询顾问。
- 客户应在项目开始时提供必要的办公条件包括办公座位、会议室、互联网设施、效果良好的电话或视频会议设施、投影仪、白板等。
- 客户应在华为承接服务后,提供必要的调研时间、相关资料协助配合华为开展咨询调研服务。
- 本项目所有工作记录和文档以中文为工作语言,根据甲方需求提供。提交的电子文档为Microsoft Word、Microsoft PowerPoint、Microsoft Excel。
服务范围
服务流程
服务交付件
- 确定性运维规划服务
服务项
交付件
验收报告
运维数字化转型诊断(基础版)
现状调研与诊断分析报告
确定性运维规划与设计服务验收报告
运维数字化转型诊断(专业版)
现状调研与诊断分析报告
确定性运维规划与设计服务验收报告
确定性运维评估与规划-中型企业(基础必选)
现状调研与诊断分析报告
确定性运维规划与设计服务验收报告
确定性运维整体规划与演进路标
确定性运维评估与规划-中型企业(基础必选)
现状调研与诊断分析报告
确定性运维规划与设计服务验收报告
确定性运维整体规划与演进路标
- 确定性运维设计服务
服务项
交付件
验收报告
运维组织架构设计-(中型企业)增量包1
运维组织架构详细设计
华为云确定性运维规划与设计服务验收报告
运维组织架构设计-(大型企业)增量包1
运维组织架构详细设计
华为云确定性运维规划与设计服务验收报告
运维流程设计-(中型企业)增量包2
运维流程规范详细设计
华为云确定性运维规划与设计服务验收报告
运维流程设计-(大型企业)增量包2
运维流程规范详细设计
华为云确定性运维规划与设计服务验收报告
责任矩阵
- 共同责任
- 华为责任
- 服务前,按照客户所选服务项,制定服务计划和报价清单供客户审核确认。
- 服务期间,依确认后的服务计划进行实施,编写交付件,及时提交交付件,如有争议,在双方友好协商的基础上对交付件进行完善。
- 服务结束后,根据所选服务项,出具交付件清单。
- 客户责任
- 专注在满足项目交付需要,及时反馈管理层和关键业务部门对项目的各种意见。
- 客户需要指派一位项目负责人协助华为云咨询顾问,便于项目的顺利落地。此负责人应该承担双方的协调管理,与华为项目经理一起管理项目变更控制流程。
- 协调安排项目干系人配合项目实施,参加项目会议,访谈和讨论会,在提供咨询服务的过程中,如客户组织的活动中含有客户侧的第三方,客户须负责与第三方交涉,协助咨询顾问解决问题。
- 结合项目需求,及时、完整地提供本项目所需要的信息和资料。
- 在华为提供交付件后,及时组织相关方进行评审验收。
- 责任分工矩阵表
- R=责任方/Responsibility
- S=协助方/Support
序号
服务流程
工作内容
华为
客户
1
项目开工会
与客户项目负责人(团队)进行沟通,需求识别收集、建立预期目标、明确咨询流程、内容、交付物对齐、识别干系人、制定工作计划
R
S
2
理念导入
确定性运维理念导入
R
S
3
现状调研
通过访谈和调研的方式针对客户运维现状进行整体调研,识别各个领域的痛点和挑战,相关文档收集及汇总,现状理解记录
R
S
4
现状调研确认
客户确认现状调研结果
S
R
5
分析评估
为客户全面评估运维成熟度,根据成熟度评估结果制定确定性运维目标,分析运维现状与确定性运维目标的差距及需要提升的领域
R
S
6
分析评估确认
客户确认分析评估报告
S
R
7
里程碑一《现状调研与诊断分析报告》交付件验收汇报
客户在7个工作日内确认方案,如无异议,签署里程碑一交付件《确定性运维规划与设计服务验收报告》后即完成验收
S
R
8
高阶整体蓝图规划与演进路标
运维组织架构、流程规范、工具体系、确定性运维能力、度量架构蓝图顶层规划以及1到3年的演进路标
R
S
9
里程碑二《整体规划和演进路标》交付件验收汇报
客户在7个工作日内确认方案,如无异议,签署里程碑二交付件《确定性运维规划与设计服务验收报告》后即完成验收
S
R
10
运维组织架构详细设计
结合《现状调研与诊断分析报告》和《确定性运维整体规划与演进路标》帮助客户设计适合企业的组织架构和岗位职责
R
S
11
里程碑三《运维组织架构详细设计》交付件验收汇报
客户在7个工作日内确认方案,如无异议,签署里程碑三交付件《确定性运维规划与设计服务验收报告》后即完成验收
S
R
12
运维流程详细设计
详细设计适合客户业务需要的七套运维流程和规范包含(变更管理、监控告警含Oncall管理、事件管理含WarRoom、回溯改进管理、问题管理、容量管理、交付转维)
R
S
13
里程碑四《运维流程规范详细设计》交付件验收汇报
客户在7个工作日内确认方案,如无异议,签署里程碑四交付件《确定性运维规划与设计服务验收报告》后即完成验收
S
R
验收标准
咨询团队会基于客户下单内容,输出交付成果。交付物完整提交后,客户在7个工作日内确认方案,如无异议,签署《确定性运维规划与设计服务验收报告》后即完成验收。如果华为在交付件提交给客户后的7个工作日内尚未收到客户的书面反馈意见,则该轮提交的交付件将被视为已被客户接受并作为最终版本验收通过。