产品介绍
服务概述
在数字化经济高速发展的背景下,企业上云已成为提升业务敏捷性、降低运营成本的必然选择。部分企业核心业务CloudScope Region部署于公有云平台,初期满足了业务快速上线和弹性扩展需求。然而,随着业务规模全球化扩张、安全威胁升级、政务合规问题以及市场竞争加剧,标准化云服务平台的局限性日益凸显,为了满足客户运维的高可用性,华为云推出专业服务解决方案,助力客户解决云平台问题,提升运维效率、节省运维成本。
服务内容
- 基础设施管理IMS
服务规格
服务内容
适用场景
协维服务基础版-标准包-100服务器
基础版协维服务:集中日常运维事务,保障业务正常运行,包含的服务有:告警监控、事件处理、问题处理、故障处理和变更处理
1、客户购买HCSO云平台
2、客户有运维团队,但是运维能力无法满足业务的需求
3、客户承担日常运维工作和运维管理责任,华为协助
4、客户需要华为帮助其构建云平台运维能力
协维服务基础版-服务器规模增量包-100服务器
协维服务基础版-高阶云服务增量包-5服务
协维服务尊享版-标准包-100服务器
尊享版协维服务:包含基础版协维服务,增加运维管理、版本升级、主动预防和能力构筑高价值部分进行协维服务
1、客户购买HCSO云平台
2、客户有运维团队,但是运维能力无法满足业务的需求
3、客户承担日常运维工作和运维管理责任,华为协助
4、客户需要华为帮助其构建云平台运维能力
协维服务尊享版-服务器规模增量包-100服务器
协维服务尊享版-高阶云服务增量包-5服务
协维驻场服务
此服务内容按具体项目,根据客户诉求和驻场人数提供区别化的服务内容,具体项目单独评估
根据客户项目诉求
运维平台协维服务-基础包
1、告警监控:对运维平台进行7*24实时监控,对发现的告警进行处理,监控不涉及客户业务系统监控
2、事件处理:对发现的问题由运维团队创建事件单,按工单处理流程配合现场运维人员处理
3、变更实施:同客户进行变更实施包含配置变更、版本升级、特性迭代等,客户受理变更请求并进行相关变更实施,包括变更受理、变更准备、变更方案制定与评审、变更实施、变更结果确认等操作
4、问题巡检:定期对运维平台进行巡检,通过巡检发现云平台潜在的故障风险,针对识别的风险项启动整改修复
5、重大故障处理:运维平台发生紧急故障造成客户业务中断时,对故障进行定界、定位,包括受理和通报、故障定位、恢复和问题关闭等运维活动
备注:此工作范围只适用于运维平台
根据客户项目诉求
运维平台代维服务-基础包
运维平台协维服务-增量中级包
1、漏洞排查:定期对运维平台可能涉及到的漏洞进行排查,发现漏洞后联系研发专家获取漏洞修复方案并修复现网漏洞。
2、隐患排查:为避免运维平台出现同类型故障,进行的事后总结工作。让出现的故障处于可控或收敛状态,从故障中提炼、固化一些运维流程和效率的提升,同时客观的认清业务当前稳定性现状,寻求最佳的解决办法
3、问题管理服务:对问题种类分析,问题量趋势分析、共性问题根因分析提出整改优化措施,针对已上升未解决问题进行跟踪管理,推动原厂快速解决技术问题,针对未上升问题,协调推动问题解决并分析解决质量
4、风险管理服务:对运维平台使用情况、云服务规模情况、业务情况、运维流程等进行潜在风险的识别、评估和分析并选择最有效的方式,主动地、有计划地处理潜在风险
5、资源和容量管理服务:对运维平台的资源使用情况、资源冗余度、容量预测、资源容量痛点等对客户的现网进行分析并给出针对性建议,指导客户进行资源扩容、重构或者演进
6、演练服务:协助客户开展演练服务,构建演练服务能力,通过故障注入,验证故障快速恢复能力及系统可靠性的实践活动
7、告警优化:针对重复告警,制定更智能的抑制规则。收集处理告警过程中的问题和建议,根据反馈优化告警策略和规则
8、疑难问题处理:针对初级运维人员无法处理的告警、事件上升至中级运维人员进行定位恢复
备注:此工作范围只适用于运维平台
运维平台代维服务-增量中级包
运维平台协维服务-增量高级包
1、失效模式管理能力建设:基于业界及华为云已发生的重大业务失效模式,指导客户进行影响现网业务中断风险排查及预防
2、故障模式库能力建设:指导客户开展故障管理活动,通过历史故障梳理建立故障模式库,并进行预案的开发,确保故障快速发现、定位与恢复,保障系统稳定运行
3、风险治理能力:参照华为云SRE实践,指导客户进行变更风控能力建设,变更风控指根据不同变更场景构建风险控制能力,通过风险数字化度量分析和评估风险影响程度,并采取风险控制措施削减或规避风险,保障变更成功
4、重大保障能力建设:指导客户进行重大保障能力体系建设,保障前:组建保障团队,组织启动会、识别容量和可用性风险并闭环,未闭环的制定应急预案;保障中:做好保障值守和业务巡检,处理保障中的应急问题;保障后:进行总结优化
备注:此工作范围只适用于运维平台
运维平台代维服务-增量高级包
运维平台专属运维经理-中级
1、提供5*8h告警监控及工单支持,7*24h重大故障组织恢复
2、告警优化:检查告警规则覆盖范围及合理性;详细了解客户业务流程及需求,明确指标对业务影响,制定告警规则;告警分析:定期对告警数据进行分析,总结告警的趋势、类型和分布情况;通过数据分析,发现系统中存在的潜在问题和薄弱环节
3、通过历史故障梳理建立故障模式库,并进行预案的开发,确保故障快速发现、定位与恢复,保障系统稳定运行
4、将华为云运维实践经验和专业技术融入客户工作流,协助优化运维流程,节省运维时间和人力成本
5、重大节假日保障方案制定,针对云平台进行系统巡检、监控预警、应急响应、资源保障和网络安全防护等重大保障措施,确保系统在此期间稳定运行
运维平台专属运维经理-高级
在中级专属运维经理服务内容基础上增加:安全生产能力建设、业务赋能
安全生产能力建设:制定安全生产红线及运维规范,从组织建设、制度建设、风险评估和技术落地等角度构建安全生产管控能力
业务赋能:协助客户全面提升其产品力和运维能力,赋能范围包括但不限于运维流程、规章制度、运维工具、安全生产、云服务运维技能
机房搬迁小型规模
项目管理、搬迁可行性分析、机房工勘及新机房LLD输出、搬迁方案设计、搬迁演练、搬迁风险分析及控制、搬迁启动会、数据中心下电、数据中心上电、平台恢复、搬迁总结
小型规模:设备规模100以内
机房搬迁中型规模
中型规模:设备规模100-500
机房搬迁大型规模
大型规模:设备规模500以上
代维服务基础版-标准包-100服务器
基础版代维服务:集中日常运维事务,保障业务正常运行,包含的服务有:告警监控、事件处理、问题处理、故障处理和变更处理
1、客户购买HCSO云平台
2、客户无运维团队
3、客户有运维团队,但是运维能力无法满足业务的需求
4、华为承担日常运维工作和运维管理责任,客户协助
代维服务基础版-服务器规模增量包-100服务器
代维服务基础版-高阶云服务增量包-5服务
代维服务尊享版-标准包-100服务器
尊享版代维服务:包含基础版代维服务,在运维管理、版本升级、主动提升、平台可用性提升高价值部分进行代维服务
1、客户购买HCSO云平台
2、客户无运维团队
3、客户有运维团队,但是运维能力无法满足业务的需求
4、华为承担日常运维工作和运维管理责任,客户协助
代维服务尊享版-服务器规模增量包-100服务器
代维服务尊享版-高阶云服务增量包-5服务
代维驻场服务
此服务内容按具体项目,根据客户诉求和驻场人数提供区别化的服务内容,具体项目单独评估
根据客户项目诉求
前提条件
- 机房搬迁是专业服务,客户需有明确的搬迁预算,华为才能承接搬迁项目。
- 管理面容灾的3AZ目前无搬迁方案,不承接客户有此需求的机房搬迁项目。
- 搬迁前后平台内部IP保持不变,仅涉及公网出口IP进行变更。不承接平台全部IP按照新机房进行变更的搬迁项目。
- 搬迁需准备的备件,包含光纤、硬盘等。光纤需按照新机房的机柜摆放位置及距离确定是否复用原机房光纤,若复用原光纤,考虑光纤在搬迁过程中极易折损或进入灰尘导致无法复用,需准备20%的冗余。
- 客户应提前至少20个工作日申请该服务,提前评估客户云平台的规模,与客户签订机房搬迁服务合同,提前安排华为人力投入客户机房搬迁项目。
- 本项目所有工作记录和文档以中文为工作语言,根据甲方需求提供。提交的电子文档为Microsoft Word、Microsoft PowerPoint、Microsoft Excel。
- 客户应提前至少20个工作日申请该服务,提前评估客户云平台的规模,与客户签订授权合同,提前安排华为人力投入客户项目。
- 为客户提供服务前,需明确是远程协维场景还是本地协维场景。
- 客户应在项目开始时提供必要的办公条件,包括办公座位、会议室、网络设施、效果良好的电话或视频会议设施、投影仪、白板等。
- 已经完成华为云平台的交付工作,并且完成了转维验收,向协维团队移交云平台的相关交付件,包括不限于HLD、LLD、环境信息表等。
- 服务实施和交付期间涉及华为多种资源(包括ECS、EIP、CCE、APIG、ELB等)需求,需由客户付费。
- CloudScope连线Region运维数据迁移的规划设计与实施服务在实施前,需要满足两套CloudScope版本保持一致,如果不一致需要先进行版本升级拉齐。
- CloudScope的运维内容迁移和重新对接,不影响客户业务。
- 客户应在华为承接服务后,提供必要的调研时间、相关资料协助配合华为开展咨询调研服务。
- 双方达成一致的咨询服务目标,并完成合同签订。
- 购买智算基础设施服务必须先购买智算基础设施平台。
服务范围
- 服务覆盖范围
- 协维和代维服务覆盖范围
云用户自行负责运维的内容包括:
- 应用软件及其配套的操作系统及数据库。
- 机房的风火水电管理,物理服务器和物理网络设备的备件更换职责。
华为提供的服务内容包括:
- 现场流程管理及服务台:作为客户单点沟通接口,受理客户投诉、建议及问题咨询,基于流程对故障、变更、问题等进行跟踪闭环,对简单问题进行解答等。
- 7*24小时告警监控:对管理对象进行告警监控,并对告警进行分级及升级,确保问题及时处理。
- 运维服务:对告警进行处理、故障定位定界及修复、配置/补丁/升级等相关的变更,日常系统巡检等。
- 机房搬迁的服务覆盖范围
- 搬迁所需的机房环境及物理搬迁过程由客户负责或者我司协助客户协调集成商负责,我司仅负责物理搬迁之外的部分,详细服务边界划分。
- 搬迁规划阶段:租户业务调研分析、搬迁可行性评估、新机房工勘、老机房LLD校对、新机房LLD输出、搬迁方案设计 、优雅上下电runbook。
- 搬迁前准备阶段:搬迁演练、管理面数据备份、搬迁风险分析及控制、搬迁启动会。
- 搬迁实施阶段: 设备上电、基础平台恢复、告警处理、平台值守保障。
- 搬迁总结阶段:搬迁复盘总结。
- 协维和代维服务覆盖范围
- 服务不覆盖范围
- 代维&协维服务不覆盖范围
- 租户侧的业务开发支持,业务系统问题处理不在协维服务范围内。
- MRS大数据开发支持工作不在服务条款内。
- 系统架构调研。
- 表设计开发建议。
- 组件开发指导。
- 组件选型指导。
- 性能调优。
- 第三方平台对接。
- 应用对接与上线保障。
- DWS数仓开发支持工作不在服务条款内。
- 系统架构调研。
- 表设计开发建议。
- 组件开发指导。
- 组件选型指导。
- 性能调优。
- 第三方平台对接。
- 应用对接与上线保障。
- DB数据库开发支持工作不在服务条款内。
- 数据库开发指导。
- 数据库性能调优。
- 数据库第三方平台对接。
- 应用对接与上线保障。
- Roma应用集成开发支持不在服务条款内。
- 应用集成开发需求调研。
- 应用集成开发安装部署支持。
- 应用集成开发框架培训和演示。
- 应用集成开发定制和改造支持。
- 应用集成开发测试支持。
- 应用集成开发服务订购支持。
- 非华为产品引入的运维工具不在服务范围内。
- 超出HCSO云平台运维不在服务范围内。
- 机房搬迁服务不覆盖范围
- 新机房建设:其中包括风火水电等基础设施建设。
- 物理搬迁:设备下架、设备打包、设备运输、设备上架、设备连线、设备连线核查。
- 备件准备:隶属客户资产硬件,备件及坏件更换由客户主导负责,涉及第三方设备,由客户推动第三方厂家提供服务。
- 新机房上电后客户业务恢复及业务验证。
- 云平台及业务架构优化。
- 代维&协维服务不覆盖范围
- 服务区域
服务流程
- 代维&协维服务
服务阶段
里程碑说明
服务申请
客户提出服务申请。
需求评估
华为方组织专家与客户详细了解客户需求并进行评估。
目标对齐
与客户确认需求范围和交付目标。
客户下单
根据客户需求进行服务配置并报价。
客户确认报价,待客户成功下单后,为客户提供实施交付计划。
实施交付
项目开始正式启动,项目组成员开始入场进行运维工作。
交付件提供
为客户提供相关交付件,故障处理报告、运维月报、深度巡检报告、风险排查报告等。
验收报告签署
为客户提供相关交付件后,与客户确认内容,确认后完成验收报告签署。
- 机房搬迁
服务阶段
里程碑说明
提交服务申请
客户提出服务申请。
需求沟通确认
华为方会组织专家跟客户详细了解需求并进行评估。
和客户确认需求范围和交付目标。
服务订单确认
与客户确认需求范围和交付目标。
客户下单
根据客户需求进行服务配置并报价。
客户确认报价,待客户成功下单后,为客户提供实施交付计划。
服务咨询与实施
项目开始正式启动。
整理最终的项目验收材料,交付件。
服务验收
根据客户下单产品,客户签署《机房搬迁服务验收报告》。
项目完成验收。
服务交付件
服务名称 |
交付件 |
验收报告 |
---|---|---|
协维服务基础版-标准包-100服务器 |
《故障处理报告》 《运维月报》 |
华为按各服务子项提交“服务交付件”章节所述标准交付件,周期性专业服务不涉及验收 |
协维服务基础版-服务器规模增量包-100服务器 |
||
协维服务基础版-高阶云服务增量包-5服务 |
||
协维服务尊享版-标准包-100服务器 |
《故障处理报告》 《运维月报》 《深度巡检报告》 《风险排查报告》 |
|
协维服务尊享版-服务器规模增量包-100服务器 |
||
协维服务尊享版-高阶云服务增量包-5服务 |
||
协维驻场服务 |
《驻场服务周报》 |
|
运维平台协维服务-基础包 |
《故障处理报告》 《深度巡检报告》 《风险排查报告》 《运维月报》 |
华为按各服务子项提交“服务交付件”章节所述标准交付件,周期性专业服务不涉及验收 |
运维平台协维服务-增量中级包 |
||
运维平台协维服务-增量高级包 |
||
运维平台代维服务-基础包 |
||
运维平台代维服务-增量中级包 |
||
运维平台代维服务-增量高级包 |
||
运维平台专属运维经理-中级 |
《运维周报》 |
|
运维平台专属运维经理-高级 |
||
机房搬迁小型规模 |
《新机房LLD》 《机房搬迁服务方案》 《上下电实施方案》 《机房搬迁服务总结报告》 |
《机房搬迁服务验收报告》 |
机房搬迁中型规模 |
||
机房搬迁大型规模 |
||
代维服务基础版-标准包-100服务器 |
《故障处理报告》 《运维月报》 |
华为按各服务子项提交“服务交付件”章节所述标准交付件,周期性专业服务不涉及验收 |
代维服务基础版-服务器规模增量包-100服务器 |
||
代维服务基础版-高阶云服务增量包-5服务 |
||
代维服务尊享版-标准包-100服务器 |
《故障处理报告》 《运维月报》 《深度巡检报告》 《风险排查报告》 |
|
代维服务尊享版-服务器规模增量包-100服务器 |
||
代维服务尊享版-高阶云服务增量包-5服务 |
||
代维驻场服务 |
《驻场服务周报》 |
责任矩阵
- 共同责任
- 双方商定并确认具体的业务需求及目标。
- 双方商定并确认项目管理计划。
- 双方商定并确认方案内容并评审。
- 完成合同签订。
- 华为责任
- 华为云需明确此次项目的负责人,因特殊情况导致华为人员变更,需要提前3个工作日知会客户,直至项目最终验收完成。
- 华为云得到客户授权后,授权数据仅限用于稳定性提升服务中涉及的服务内容,不得超出限定范围。
- 服务前,按照客户所选服务项,制定服务计划和报价清单供客户审核确认。
- 服务期间,依确认后的服务计划进行实施,编写交付件,及时提交交付件,如有争议,在双方友好协商的基础上对交付件进行完善。
- 服务结束后,根据所选服务项,出具交付件清单。
- 客户责任
- 客户需指派一位项目负责人负责双方之间协调及管理、审核、验收华为云提供的服务。
- 客户必须提供业务系统相关的信息(包括但不限于应用架构、部署架构、资源数量和性能)。
- 由于云平台的硬件设备部署在客户机房,客户提供对机房的风火水电的运维、服务器现场运维(备件更换、上下电、线缆调整等)、物理网络设备(交换机、路由器、防火墙等)现场运维(备件更换、上下电、线缆调整等)和VPN远程运维通道运维。
- 客户部署在租户面上的业务应用系统须由客户进行运维。
- 专注在满足项目交付需要,及时反馈管理层和关键业务部门对项目的各种意见。
- 协调安排项目干系人配合项目实施,参加项目会议,访谈和讨论会,在提供咨询服务的过程中,如客户组织的活动中含有客户侧的第三方,客户须负责与第三方交涉,协助咨询顾问解决问题。
- 结合项目需求,及时、完整地提供本项目所需要的信息和资料。
- 在华为提供交付件后,及时组织相关方进行评审验收。
- 责任分工矩阵表
- 代维&协维基础版和尊享版服务
以下为职责描述案例,可酌情修改;
R=责任方Responsibility
S=协助方/Support
服务种类
服务小类
工作内容
客户
华为
客户自有机房运维管理
资源池机房维护
客户提供机房风火水电等定期巡检
R
\
坏件更换
提供硬盘、硬盘背板、Raid卡、网卡、内存等坏件更换服务
R
\
备件管理及硬件扩减容
提供机硬件扩容减容服务,进行平台备件管理
R
\
网络运维
数据中心网络运维
数据中心网络设备配置信息、软件等内容维护
\
R
数据中心网络硬件维护
网络设备硬件更换及维保
R
\
云平台网络
提供云平台虚拟网络运维服务
\
R
应用业务运维
用户OS运维
用户OS层上的监控与维护
R
S
用户业务运维
应用层业务运维及升级
R
S
用户云服务器内License申请、维护
云服务器内License申请、维护,由客户自行申请
R
S
用户云服务器内安全加固
云服务器内安全加固,定期维护
R
S
私有镜像制作
通过华为提供的私有镜像指南,按照规范制作私有镜像使用
R
S
业务发放
应用层于HCS平台业务发放
R
S
租户安全运维
如租户侧安全防护、云主机安全加固,安全事件处理
R
S
公共镜像制作
华为云与客户协商提供相应的公共镜像
S
R
云平台运维
集中监控及告警处理
按照监控平台进行资源池7*24小时监控,及时识别故障和隐患
S
R
资源池变更升级、软硬件补丁等变更(限尊享版)
按照变更流程规范规划资源池变更升级、软硬件补丁等,重大变更需要知会到客户,并与客户沟通变更影响及变更时间窗
/
R
资源池容量预测(限尊享版)
用户根据自身业务需求负责云平台容量需求预测,并及时通知华为
R
S
资源池容量监控(限尊享版)
按照容量管理规范,进行云平台容量监控,并及时知会容量风险;
S
R
硬件巡检
客户提供提供资源池硬件日常巡检,检查现场设备事件、告警和错误等信息,
S
R
投诉处理及定位
按照业务响应流程进行问题响应及处理
S
R
故障报告提供
对已处理的问题/故障,提供故障报告
S
R
平台安全运维(限尊享版)
负责云平台安全运维,包括漏洞管理补丁修复、安全事件响应
S
R
- 运维平台协维服务
以下为职责描述案例,可酌情修改;
R=责任方Responsibility
S=协助方/Support
服务种类
服务小类
工作内容
客户
华为
云平台运维
集中监控及告警处理
按照监控平台进行资源池7*24小时监控,及时识别故障和隐患
S
R
资源池变更升级、软硬件补丁等变更
按照变更流程规范规划资源池变更升级、软硬件补丁等,重大变更需要知会到客户,并与客户沟通变更影响及变更时间窗
/
R
资源池容量预测
用户根据自身业务需求负责云平台容量需求预测,并及时通知华为
R
S
资源池容量监控
按照容量管理规范,进行云平台容量监控,并及时知会容量风险;
S
R
硬件巡检
客户提供提供资源池硬件日常巡检,检查现场设备事件、告警和错误等信息,
S
R
投诉处理及定位
按照业务响应流程进行问题响应及处理
S
R
故障报告提供
对已处理的问题/故障,提供故障报告
S
R
平台安全运维
负责云平台安全运维,包括漏洞管理补丁修复、安全事件响应
S
R
- 运维平台代维服务
以下为职责描述案例,可酌情修改;
R=责任方Responsibility
S=协助方/Support
服务种类
服务小类
工作内容
客户
华为
云平台运维
集中监控及告警处理
按照监控平台进行资源池7*24小时监控,及时识别故障和隐患
S
R
资源池变更升级、软硬件补丁等变更
按照变更流程规范规划资源池变更升级、软硬件补丁等,重大变更需要知会到客户,并与客户沟通变更影响及变更时间窗
S
R
资源池容量预测
用户根据自身业务需求负责云平台容量需求预测,并及时通知华为
S
R
资源池容量监控
按照容量管理规范,进行云平台容量监控,并及时知会容量风险;
S
R
硬件巡检
客户提供提供资源池硬件日常巡检,检查现场设备事件、告警和错误等信息,
S
R
投诉处理及定位
按照业务响应流程进行问题响应及处理
S
R
故障报告提供
对已处理的问题/故障,提供故障报告
S
R
平台安全运维
负责云平台安全运维,包括漏洞管理补丁修复、安全事件响应
S
R
- 机房搬迁服务
以下为职责描述案例,可酌情修改;
R=责任方Responsibility
S=协助方/Support
服务种类
服务小类
工作内容
客户
华为
搬迁规划
调研
租户业务调研分析
R
S
可行性评估
R
S
机房工勘及新机房LLD输出
新机房工勘
R
S
老机房LLD校对
R
S
新机房LLD输出
R
S
搬迁方案设计
搬迁方案设计
R
S
搬迁准备
备件准备
备件准备
S
R
内部账户准备
内部账户准备
R
S
关键数据备份
关键数据备份
S
R
搬迁授权
搬迁授权
S
R
搬迁演练
搬迁演练
R
S
搬迁风险
搬迁风险分析及控制
R
S
搬迁启动会
搬迁启动会
R
S
搬迁实施
老机房业务关闭
cloudscope运维功能屏蔽
R
S
全局下电
R
S
物理搬迁
设备下架前处理
S
R
设备下架
S
R
设备打包
S
R
设备防护处理
S
R
运输
S
R
设备上架前处理
S
R
设备上架
S
R
连线核对
S
R
新机房业务恢复
全局上电
R
S
基本连通性检查
R
S
cloudscope运维功能恢复
R
S
拨测验证
R
S
租户业务恢复
S
R
告警处理
R
S
业务验证
S
R
平台保障
R
S
搬迁总结
搬迁总结
搬迁总结
R
S
客户验收
S
R
- 代维&协维基础版和尊享版服务
验收标准
线上&线下验收标准参考:华为按各服务子项提交标准交付件,客户在华为官网Console点击确认验收,或线下签字且盖章《xxxxx服务验收报告》作为服务验收通过依据,周期性专业服务不涉及验收。