更新时间:2022-08-16 GMT+08:00

容灾和多活策略

DCS缓存实例都存储着大量关键数据,不论是作为数据库前端缓存,还是作为数据存储引擎,数据的可靠性与服务的连续可用性是DCS服务设计上为客户考虑的核心因素,下图展示了DCS在数据和服务方面的容灾架构设计演进。

图1 DCS容灾架构演进

根据对数据与服务的不同可靠性要求,您可以选择将缓存实例部署在单可用区内(单机房),或者跨可用区(同城灾备)。

实例单Region单可用区高可用

同一机房即单可用区。单可用区灾备策略主要包括进程/服务高可用,数据持久化到磁盘,以及实例节点间热备三种不同层次。

在单可用区内,单机实例通过进程守护的方式确保服务高可用,当DCS监测到缓存实例进程故障,马上拉起一个新的进程继续提供服务。

图2 单可用区内单机实例高可用

主备实例配置了数据持久化,数据不仅会持久化到主节点磁盘,还会增量同步到备节点,同时备节点也会持久化一份数据。因此,主备实例实现了节点热备和持久化文件多个备份。

图3 单可用区内主备实例高可用

集群版实例类似主备实例,每个条带(实例进程)有持久化文件,也都有对应的副本(备进程及其持久化文件。)

图4 单可用区内集群版实例高可用

实例单Region跨可用区灾备

主备与集群版本的缓存实例支持将主备副本部署在不同的可用区内(即不同的物理机房)。不同可用区的电力、网络相互隔离,当主节点所在的机房因为电力或者网络出现故障,备节点将接管服务,客户端与备节点正常建立连接以及读写数据。

图5 实例跨可用区示意图

上图为主备实例跨可用区部署示意,集群版实例与主备实例类似,每一个条带(进程)都跨可用区部署。

对于同城容灾,只需要在创建主备/集群实例时,选择与主可用区不同的备可用区。如下图所示:

图6 购买实例选择不同可用区部署

您的应用也可以部署为跨可用区的HA模式,这样不仅能保证数据高可靠,还能在机房遇到断电或网络故障时,服务继续可用。

实例跨Region多活

当前Redis没有成熟的双活(Active-Active,注意不同于灾备或者主备高可用)方案,华为云DCS不支持跨Region多活功能。

这是由于私有定制Redis通信协议(RESP协议)的标准无法统一等原因无法实现跨云/Region的Redis侧双活,因此,如果需要双活,可以通过应用侧进行双写改造实现。

图7 应用侧双写实现多活

说明:

  1. 双写方案无法保证缓存的一致性(网络出现问题),需要应用侧可以容忍对应的缓存不一致场景(通过设置过期时间等达到最终一致性),应用如果依赖缓存强一致性,则不合适该方案,跨Region缓存强一致性当前业界没有方案可以实现。
  2. 建议操作跨Region的二级缓存采用异步的方式。