更新时间:2022-12-19 GMT+08:00

集群容灾

技术背景

为了对于GaussDB(DWS)集群的提供容灾能力,采用双集群周期同步数据的方式,将主集群数据同步到跨AZ/Region的集群。当前的双集群方式是对比了业界几种典型的方式:应用侧双写,异地多副本之后,结合GaussDB(DWS)自身的架构特点以及容灾方案的可复制性而确定的。

技术原理

双集群容灾架构说明

  • 数据同步方式:两个DN数相同的集群间,使用节点间点对点的同步数据,充分复用MPP分布执行的特点。两个集群间需要打通网络,配置互信并确保DN数一致。
  • 周期同步方式:通过可配置的时间间隔周期的进行数据同步
  • 数据内容:对于集群内的数据,行存、列存、lib库,配置信息都会同步

集群切换:

容灾切换分两种,一种是计划性的切换,用于容灾演练,另一种是故障切换,在发生故障时进行切换。

对于计划性切换,RPO = 0的,主集群将数据同步到备集群后降备集群;故障切换时,备集群立即升主,此时RPO !=0。

效果收益

两套集群的高可用容灾方案,耦合性比较松, 是Oracle,DB2等厂商选择的方案。 优点在于:(a) 两套集群是独立的,备集群不影响主集群。(b) 通过两套集群之间的切换,比较容易实现大版本的软件升级和应用升级。 有力支撑大规模MPP集群的数据安全保护能力。

了解更多请参见集群容灾