云上容灾的方案与说明
云上容灾有三种场景,如表1所示。
名称 |
容灾的项目 |
适用场景 |
---|---|---|
跨AZ容灾 |
应用和数据库。 |
云上同城容灾,适用于要求RPO等于0的场景。 |
跨Region容灾 |
应用和数据库。 |
云上异地容灾,适用于要求对地域性灾难提供可靠性的场景。 |
云上两地三中心 |
应用和数据库。 |
同时兼顾业务持续性和地域性灾难恢复两个方面,是跨AZ容灾和跨Region容灾的方案结合。 |
跨AZ容灾
跨AZ容灾的方案如图1所示。
该架构适用云上同城容灾,要求RPO等于0的场景。
该方案下,RPO等于0,RTO小于30分钟。在平时业务系统正常运行时,容灾系统中的云服务器不启动,能够有效地降低容灾成本,同时提供一键容灾切换与演练功能,有效降低容灾管理难度。
该架构的方案实现如下:
- 通过DNS服务,将用户的访问流量引流到业务系统;当业务系统不正常时,将流量引流到容灾系统。
- 应用服务器的数据同步:Web服务和其他应用服务通过SDRS存储同步复制服务,实现数据同步;业务系统正常运行时,容灾系统中的云服务器不启动。
- 数据库的数据同步:使用RDS作为数据库,跨AZ主备部署,跨AZ数据同步。
- 容灾切换:当业务系统发生故障时,RDS数据库自动切换,应用层可通过SDRS的一键容灾切换功能切换至容灾系统。DNS将用户的访问流量全部引流到容灾系统。
- 容灾演练:租户可自行通过SDRS提供容灾演练功能进行一键演练。
跨Region容灾
跨Region容灾的方案如图2所示。
该架构适用云上异地容灾,可防止地域性质的灾难损害。
该方案下,业务系统和容灾系统部署在不同的城市,可靠性更高。在平时业务系统正常运行时,容灾系统中的云服务器不启动,能够有效地降低容灾成本,同时提供一键容灾切换与演练功能,有效降低容灾管理难度。
该架构的方案实现如下:
- 通过DNS服务,将用户的访问流量引流到业务系统;当业务系统不正常时,将流量引流到容灾系统。
- 应用服务器的数据同步:Web服务和其他应用服务通过第三方工具进行数据的同步复制。业务系统正常运行时,容灾系统中的云服务器不启动。
- 数据库的数据同步:使用RDS作为数据库,跨Region主备部署,跨Region数据同步。
- 容灾切换:当业务系统发生故障时,可通过人工方式或通过第三方软件,切换数据库的主备状态;DNS将用户的访问流量全部引流到容灾系统。
- 容灾演练:用户可自行通过脚本方式或第三方工具进行容灾演练。
云上两地三中心
云上两地三中心的方案如图3所示。
该架构适用对业务连续性和数据可用性要求高的场景,能够在大规模地域级自然灾害的时候,保护数据和业务。
该架构的方案实现如下:
- 业务系统和容灾系统部署在云上不同的Region中。业务系统部署在同一Region的两个AZ中,容灾系统部署在另外一个Region的AZ中。
- 在业务系统和容灾系统中分别部署RDS,数据库1:1:1复制。
- 业务系统和容灾系统产生的配置信息、日志、快照和备份文件等,通过OBS跨区复制。
- 业务系统中一个AZ故障时,将业务切换到另外一个AZ上,数据库进行主备切换。
- 业务系统整体发生故障时,将业务切换到容灾系统,同时DNS将客户的访问流量引流到容灾系统上。业务系统恢复正常时,重新将访问流量切回到业务系统。
- 两个地域之间可通过DNS实现负荷分担,容灾中心可以处理部分只读和数据分析业务。