更新时间:2025-02-24 GMT+08:00
分享

实施步骤

需求调研

动机和驱动因素

某客户在中国使用友商云,但是友商云产品合同即将到期,且集团战略需要使用国产云来承载所有的基础设施平台,客户集团战略是将本地数据中心、友商云承载的大部分应用系统迁移到华为云上。

客户主要痛点集中在以下几个方面:

  • 客户遍布全国乃至全球,需要有良好的用户接入体验。受特殊时间节点(月末、季末、年末)、活动(促销、涨价)等出现峰值波动。
  • 资源不能弹性伸缩,CPU、内存、存储等资源利用不均衡。使用CDH开源版本老旧(开源社区已不维护),问题较多,不稳定,运维成本较大,难以支撑每日的报表计算。线下的大数据平台计算能力有限,只能勉强支撑当前的经营分析报表(每日批量计算时常故障),承接新增需求较为困难。
  • 资源不能平滑扩展,资源扩容周期长。多地域分支机构接入访问体验无法保障。
  • 核心系统对系统可靠性、安全性要求非常高。

上云总体战略:为满足客户数字化转型的业务需要,支撑应用架构和数据架构,定义集团未来数字化转型过程中上云的总体策略。上云总体策略应该遵循统一规划、分步建设、统一体系、价值导向原则。

图1 上云总体战略

迁移规划

应用迁移规划:基于客户的云化战略,未来不再新增IDC资源,并结合业务应用特点,计划关停的系统、开发测试系统等仍保留在本地机房,充分利旧,应用分批稳步迁云。

图2 应用迁移规划

分批迁移上云策略

  • 面向外部用户的应用及速赢类应用第一批次迁移上云:面向渠道、终端客户等外部的营销类应用,发挥云的资源弹性优势,应对节日、促销等需求波动大的场景,提升外部用户体验;大数据平台当前故障频繁、算力有限,上云后能快速解决问题;一阶段涉及到团队磨合,流程固化,POC,原子方案论证,故周期较长。
  • 面向内部办公及作业效率提升的应用第二批次迁移:OA系统面向内部办公,上云后实现员工随时随地接入体验和移动办公;电商平台上云后通过API快速对接第三方电商,客服中心利用云呼叫中心、AI语音等云能力,提升作业效率。
  • 企业作业流程的核心业务系统:人财物系统最后迁移:人财物等支柱型应用,系统关联关系复杂,涉及范围广,迁移难度大,故最后一批迁移上云,迁移留有充足的时间进行迁移方案论证及POC。
  • 相同领域尽量同批次迁移:相同领域系统之间交互较多,应尽量减少跨云调用,同时方便集中人力资源和项目组资源协调,利于迁移实施顺利开展。

迁移风险及应对举措:对迁移可能碰到的问题和风险进行评估。包含(但不限于):迁移方案可行性、网络环境稳定性、迁移切换时间及人工成本等。

表1 迁移风险及应对举措

挑战

关键举措

迁移方案是否可行

  • 现网协调测试环境进行迁移方案验证

迁移网络不稳定

  • 建设迁移专用网络,专线可大大提高网络稳定性及迁移速率

迁移切换时间窗口很小

  • 分析业务系统允许停机窗口,选择业务最低谷时期切割

如何保证上云过程中的安全防护

  • 人员方面,实施技术人员将严格按照客户信息化安全防护要求执行相关安全保密规定
  • 系统方面,迁移上云安全原则为坚决避免带病上云,对于现有系统,上云前均强烈建议做好安全体检(从硬件到软件),并出具健康检查报告,并执行安全扫描后允许上云

应用系统验证人员保障

  • 提前协调好应用系统验证人员

迁移失败怎么办

  • 做好数据备份及应急回退机制,当出现迁移失败时,及时回退,确保业务不受影响

云上方案架构

云上目标架构设计思路
图3 云上方案架构

华为云网络设计

  • 云上VPC划分为运维监控VPC、NAT VPC、生产VPC、SAP-VPC、开发测试VPC、大数据VPC;
  • 生产VPC,按照领域划分多个子网,独立中间件子网、SAP子网、数据库子网进行细粒度管控,通过安全组及ACL进行访问控制;
  • 运维监控VPC放置堡垒机;
  • 开发测试 VPC,用于开发测试环境;
  • NAT-VPC为预留扩展用;
  • 预留了大数据VPC;
  • 公网流量先经过公用的Anti-Ddos、WAF,进行防护;
  • 外网流量经ER引流至CFW进行边界防护;
  • VPC之间采用对等连接,内网流量不经过ER;
  • 云上与IDC之间通过专线连接;

华为云安全设计

图4 华为云安全设计

基于客户IDC安全现状,云上架构需要考虑构建面向全局的纵深防护体系和全局安全动态感知能力;

  • 网络层:

    网络侧部署DDoS云原生防护,对DDoS攻击进行四层以下的防护;

    部署WAF方案,对HTTP、HTTPs流量进行攻击防护,保证web层面安全;

    部署CFW云防火墙,对流量进行访问控制和IPS防护。

  • 主机及容器:

    对于在VPC生产的前端系统,部署主机安全-防篡改版进行主机和静态网页防护;

    对于ECS的服务器,用主机安全进行防护;

    针对容器化部署,采用容器安全进行防护。

  • 数据层:针对数据库,可考虑部署数据库安全服务对恶意删库、拖库等进行审计,并对SQL注入进行实时告警;
  • 安全管理:

    对运维操作,通过网络ACL保证运维人员操作不绕过云堡垒机, 堡垒机启用双因素,所有运维操作都可审计;

    云上审计,例如账号登录、ECS操作等通过云审计进行,底层云服务层面可通过云日志进行审计;

    针对运维健康监控,可通过云监控、AOM进行性能监控;

    通过漏扫、态势感知进行全局的缺陷管理和安全威胁的监控。

    建议定期进行安全攻防演练,将经验固化到防护方案中。

迁移实施

迁移工具选型:业务上云迁移技术选型方案如上所示,包含主机迁移、数据库迁移、存储数据迁移等方案

图5 迁移工具选型

迁移步骤

  • 环境准备:

    创建VPC、subnet、安全组、虚拟机、私网NAT、安全产品

    华为云与IDC专线互联

    备份源端

    配置源和目标端,打通迁移传输网络,配置带宽

  • 生产环境数据迁移及业务部署:

    配置ELB、私网NAT、安全组、ACL

    实施主机迁移方案,应用按子系统分步迁移

    实施缓存迁移方案

    实施数据库迁移方案,完成全量与增量数据库迁移

  • 业务验证:

    严格根据Checklist进行业务测试

    清除业务测试的脏数据

    重新权限同步业务数据

  • 生产环境割接:

    停止源端业务、增量同步数据

    核心前置机指向修改、DNS修改、切换业务

    业务验证(少量业务可能需在割接当晚验证)

相关文档