数据复制服务 DRS数据复制服务 DRS

计算
弹性云服务器 ECS
裸金属服务器 BMS
云手机 CPH
专属主机 DeH
弹性伸缩 AS
镜像服务 IMS
函数工作流 FunctionGraph
云耀云服务器 HECS
VR云渲游平台 CVR
特惠算力专区
存储
对象存储服务 OBS
云硬盘 EVS
云备份 CBR
弹性文件服务 SFS
存储容灾服务 SDRS
云硬盘备份 VBS
云服务器备份 CSBS
数据快递服务 DES
专属企业存储服务
云存储网关 CSG
专属分布式存储服务 DSS
CDN与智能边缘
内容分发网络 CDN
智能边缘云 IEC
智能边缘小站 IES
智能边缘平台 IEF
人工智能
AI开发平台ModelArts
华为HiLens
图引擎服务 GES
图像识别 Image
文字识别 OCR
自然语言处理 NLP
内容审核 Moderation
图像搜索 ImageSearch
医疗智能体 EIHealth
园区智能体 CampusGo
企业级AI应用开发专业套件 ModelArts Pro
人脸识别服务 FRS
对话机器人服务 CBS
视频分析服务 VAS
语音交互服务 SIS
知识图谱 KG
人证核身服务 IVS
IoT物联网
设备接入 IoTDA
设备管理 IoTDM(联通用户专用)
全球SIM联接 GSL
IoT数据分析 IoTA
路网数字化服务 DRIS
IoT边缘 IoTEdge
设备发放 IoTDP
开发与运维
软件开发平台 DevCloud
项目管理 ProjectMan
代码托管 CodeHub
流水线 CloudPipeline
代码检查 CodeCheck
编译构建 CloudBuild
部署 CloudDeploy
云测 CloudTest
发布 CloudRelease
移动应用测试 MobileAPPTest
CloudIDE
Classroom
开源镜像站 Mirrors
应用魔方 AppCube
云性能测试服务 CPTS
应用管理与运维平台 ServiceStage
云应用引擎 CAE
视频
实时音视频 SparkRTC
视频直播 Live
视频点播 VOD
媒体处理 MPC
视频接入服务 VIS
管理与监管
统一身份认证服务 IAM
消息通知服务 SMN
云监控服务 CES
应用运维管理 AOM
应用性能管理 APM
云日志服务 LTS
云审计服务 CTS
标签管理服务 TMS
资源管理服务 RMS
应用身份管理服务 OneAccess
区块链
区块链服务 BCS
可信跨链服务 TCS
可信分布式身份服务
智能协作
IdeaHub
开发者工具
SDK开发指南
API签名指南
DevStar
HCloud CLI
Terraform
Ansible
云生态
云市场
合作伙伴中心
华为云培训中心
其他
管理控制台
消息中心
产品价格详情
系统权限
我的凭证
客户关联华为云合作伙伴须知
公共问题
宽限期保留期
奖励推广计划
活动
容器
云容器引擎 CCE
云容器实例 CCI
容器镜像服务 SWR
应用编排服务 AOS
多云容器平台 MCP
基因容器 GCS
容器洞察引擎 CIE
云原生服务中心 OSC
容器批量计算 BCE
容器交付流水线 ContainerOps
应用服务网格 ASM
网络
虚拟私有云 VPC
弹性公网IP EIP
弹性负载均衡 ELB
NAT网关 NAT
云专线 DC
虚拟专用网络 VPN
云连接 CC
VPC终端节点 VPCEP
数据库
云数据库 RDS
数据复制服务 DRS
文档数据库服务 DDS
分布式数据库中间件 DDM
云数据库 GaussDB (for openGauss)
云数据库 GaussDB(for MySQL)
云数据库 GaussDB NoSQL
数据管理服务 DAS
数据库和应用迁移 UGO
大数据
MapReduce服务 MRS
数据湖探索 DLI
表格存储服务 CloudTable
可信智能计算服务 TICS
推荐系统 RES
云搜索服务 CSS
数据可视化 DLV
数据湖治理中心 DGC
数据接入服务 DIS
数据仓库服务 GaussDB(DWS)
应用中间件
微服务引擎 CSE
分布式消息服务Kafka版
分布式消息服务RabbitMQ版
API网关 APIG
分布式缓存服务 DCS
分布式消息服务RocketMQ版
企业应用
域名注册服务 Domains
云解析服务 DNS
云速建站 CloudSite
网站备案
商标注册
华为云WeLink
会议
隐私保护通话 PrivateNumber
语音通话 VoiceCall
消息&短信 MSGSMS
云管理网络
SD-WAN 云服务
边缘数据中心管理 EDCM
云桌面 Workspace
应用与数据集成平台 ROMA Connect
ROMA资产中心 ROMAExchange
API全生命周期管理 ROMA API
安全与合规
安全技术与应用
DDoS防护 ADS
Web应用防火墙 WAF
云防火墙 CFW
应用信任中心 ATC
企业主机安全 HSS
容器安全服务 CGS
云堡垒机 CBH
数据库安全服务 DBSS
数据加密服务 DEW
数据安全中心 DSC
云证书管理服务 CCM
SSL证书管理 SCM
漏洞扫描服务 VSS
态势感知 SA
威胁检测服务 MTD
管理检测与响应 MDR
安全治理云图 Compass
认证测试中心 CTC
迁移
主机迁移服务 SMS
对象存储迁移服务 OMS
云数据迁移 CDM
专属云
专属计算集群 DCC
解决方案
高性能计算 HPC
SAP
混合云灾备
华为工业云平台 IMC
价格
成本优化最佳实践
专属云商业逻辑
用户服务
帐号中心
费用中心
成本中心
资源中心
企业管理
工单管理
客户运营能力
国际站常见问题
支持计划
专业服务
合作伙伴支持计划
更新时间:2021-12-07 GMT+08:00
分享

PostgreSQL数据库同步

数据复制服务(Data Replication Service,简称DRS)支持将其他云PostgreSQL数据库的数据实时同步到本云云数据库PostgreSQL实例。通过DRS提供的实时同步任务,实现关键业务的数据实时流动。

本章节主要介绍了通过DRS将其他云PostgreSQL数据库实时同步至本云云数据库PostgreSQL的任务配置流程。包括以下同步场景:

  • 其他云RDS PostgreSQL实时同步至本云云数据库PostgreSQL。
  • 其他云内云主机自建的PostgreSQL数据库实时同步至本云云数据库PostgreSQL。

网络示意图

图1 其他云RDS PostgreSQL实时同步示意图
图2 其他云自建PostgreSQL数据库实时同步示意图

同步流程

图3 同步流程图

同步建议(重要)

  • 数据库同步与环境多样性和人为操作均有密切关系,为了确保同步的平顺,建议您在进行正式的数据库同步之前进行一次演练,可以帮助您提前发现问题并解决问题,如何最小化对数据库的影响请参考如下建议。
  • 强烈建议您在启动任务时选择“稍后启动”功能,将启动时间设置在业务低峰期,相对静止的数据可以有效提升一次性同步成功率,避免同步对业务造成性能影响。

同步须知(重要)

在创建实时同步任务之前,请您务必仔细阅读同步使用须知。

参考《数据复制服务快速入门》中的“使用须知”章节。

同步准备

  1. 权限准备:
    当使用 DRS 将其他云PostgreSQL数据库的数据同步到本云云数据库PostgreSQL实例时,在不同同步类型情况下,对源数据库和目标数据库的帐号权限要求如表1
    表1 同步帐号权限

    同步类型

    全量同步

    全量+增量同步

    源数据库

    • 数据库:CONNENT
    • 模式:USAGE
    • 有主键表:SELECT
    • 无主键表:SELECT、UPDATE、DELETE、TRUNCATE
    • 序列:SELECT
    • 账户:REPLICATION
    • 数据库:CONNENT
    • 模式:USAGE
    • 有主键表:SELECT
    • 无主键表:SELECT、UPDATE、DELETE、TRUNCATE
    • 序列:SELECT

    目标数据库

    CREATEDB

    CREATEDB、CREATEROLE

    • 源数据库权限设置:

      需要确保源数据库PostgreSQL的帐号权限具备表1的要求。若权限不足,需要在源数据库端开通高权限的帐号。

      目前DRS支持同步的第三方云厂商有:阿里云,腾讯云和亚马逊云。

      以阿里云云数据库RDS PostgreSQL同步到本云云数据库PostgreSQL为例,阿里云推荐使用高权限帐号。一般情况下,默认是没有开通高权限帐号的,您需要先创建高权限帐号,具体操作及注意事项可以参考阿里云提供的相关指导

    • 目标数据库权限设置:

      本云云数据库PostgreSQL实例使用初始帐号即可。

  2. 网络准备:
    源数据库需要开放公网访问。
    • 源数据库的网络设置:

      源数据库PostgreSQL实例需要开放外网域名的访问。

      以阿里云云数据库RDS PostgreSQL同步到本云云数据库PostgreSQL实例为例,一般情况下,阿里云RDS PostgreSQL不提供外网地址,需要通过申请外网地址来允许外部的应用对接,具体的操作及注意事项可以参考阿里云提供的相关指导

    • 目标数据库的网络设置:

      目标数据库默认与DRS实例处在同一个VPC内,网络是互通的,不需要进行任何设置。

  3. 安全规则准备。
    • 源数据库的安全规则设置:

      源数据库PostgreSQL实例需要将DRS同步实例的弹性公网IP添加到其网络白名单中,确保源数据库PostgreSQL实例可以与上述弹性公网IP连通。

      以阿里云云数据库RDS PostgreSQL同步到本云云数据库PostgreSQL为例,具体设置网络白名单的操作及注意事项可以参考相关指导。在设置网络白名单之前,需要先获取DRS同步实例的弹性公网IP,具体方法如下:

      DRS同步实例创建成功后,可在“源库及目标库”页面,获取DRS同步实例弹性公网IP,如图4所示:
      图4 同步实例弹性公网IP

      上述方法为精细配置网络白名单的方法,还有一种简单设置白名单的方法,在安全允许的情况下,可以将源数据库PostgreSQL实例的网络白名单设置为0.0.0.0/0,代表允许任何IP地址访问该实例。

      以上白名单是为了进行同步针对性设置的,同步结束后可以删除。

    • 目标数据库安全规则设置:

      目标数据库默认与DRS同步实例处在同一个VPC,网络是互通的,DRS可以直接写入数据到目标数据库,不需要进行任何设置。

  4. 其他事项准备:

    DRS仅支持同步PostgreSQL部分类型的DDL语句,具体支持范围请参考相关指导。请合理规划源数据库业务,不要在同步期间产生支持范围外的DDL操作。

同步步骤

  1. 创建同步任务

    1. 登录管理控制台,在服务列表中选择数据库 > 数据复制服务,进入数据复制服务信息页面。
    2. “实时同步管理”页面,单击右上角“创建同步任务”,进入同步任务信息页面。
    3. 在“同步实例”页面,填选任务名称、任务异常通知信息、描述和同步实例信息。
      图5 同步实例信息
      表2 任务和描述

      参数

      描述

      区域

      当前所在区域,可进行切换。

      任务名称

      任务名称在4-50位之间,必须以字母开头,不区分大小写,可以包含字母、数字、中划线或下划线,不能包含其他的特殊字符。

      描述

      描述不能超过256位,且不能包含! = < > & ' " \ 特殊字符。

      任务异常通知设置

      该项为可选参数,开启之后,选择对应的SMN主题,。当同步任务状态异常时,系统将发送通知。

      SMN主题

      “任务异常通知设置”项开启后可见,需提前在SMN上申请主题并添加订阅。

      SMN主题申请和订阅可参考《消息通知服务用户指南》

      时延阈值

      在增量同步阶段,源数据库和目标数据库之间的同步有时会存在一个时间差,称为时延,单位为秒。

      时延阈值设置是指时延超过一定的值后(时延阈值范围为1—3600s),DRS可以发送告警通知给指定收件人。告警通知将在时延稳定超过设定的阈值6min后发送,避免出现由于时延波动反复发送告警通知的情况。

      说明:
      • 首次进入增量同步阶段,会有较多数据等待同步,存在较大的时延,属于正常情况,不在此功能的监控范围之内。
      • 设置时延阈值之前,需要设置任务异常通知。

      任务异常自动结束时间(天)

      设置任务异常自动结束天数,输入值必须在14-100之间。

      说明:

      异常状态下的任务仍然会计费,而长时间异常的任务无法续传和恢复。设置任务异常自动结束天数后,异常且超时的任务将会自动结束,以免产生不必要的费用。

      表3 同步实例信息

      参数

      描述

      数据流动方向

      选择“入云”

      源数据库引擎

      选择“PostgreSQL”

      目标数据库引擎

      选择“PostgreSQL”

      网络类型

      选择“公网网络”。建议您开启SSL安全连接,SSL约降低20-30%的同步性能,但保证了数据的安全性。

      目标数据库实例

      选择您所创建的目标PostgreSQL实例

      同步类型

      全量+增量:

      该模式为数据持续性实时同步,通过全量过程完成目标端数据库的初始化后,增量同步阶段通过解析日志等技术,将源端和目标端数据保持数据持续一致。

      说明:

      选择“全量+增量”同步模式,增量同步可以在全量同步完成的基础上实现数据的持续同步,无需中断业务,实现同步过程中源业务和数据库继续对外提供访问。

    4. “源库及目标库”信息页面,同步实例创建成功后,填选源库信息和目标库信息,建议您单击“源库和目标库”处的“测试连接”,分别测试并确定与源库和目标库连通后,勾选协议,单击“下一步”
      图6 源库及目标库信息
      表4 源库信息

      参数

      描述

      IP地址或域名

      配置源数据库PostgreSQL实例的访问地址或域名。

      端口

      配置源数据库PostgreSQL实例的服务端口,可输入范围为1~65535间的整数。

      数据库用户名

      访问源数据库PostgreSQL的用户名。

      数据库密码

      访问源数据库PostgreSQL的用户名所对应的密码。

      SSL安全连接

      在选择公网网络进行同步任务时,为了提升数据在网络传输过程中的安全性,建议您开启SSL安全连接,对同步链路进行加密,如果开启,需要您上传CA证书。

      表5 目标库信息

      参数

      描述

      数据库实例名称

      默认为创建同步任务时选择的已创建的PostgreSQL实例,不可进行修改。

      数据库用户名

      访问目标端PostgreSQL实例的用户名。

      数据库密码

      访问目标端PostgreSQL实例的用户名所对应的密码。

    5. “同步设置”页面,选择同步对象和同步用户。
      图7 同步模式
      表6 同步对象

      参数

      描述

      增量阶段冲突策略

      数据复制服务提供的实时同步功能使用了主键或唯一键冲突策略,这些策略可以由您自主选择,尽可能保证源数据库中有主键约束或唯一键约束的表同步到目标数据库是符合预期的。

      冲突策略目前支持如下三种形式:

      • 忽略

        当同步数据与目标数据库已有数据冲突时(主键/唯一键存在重复等),将跳过冲突数据,继续进行后续同步。

      • 报错

        当同步数据与目标数据库已有数据冲突时(主键/唯一键存在重复等),同步任务将失败并立即中止。

      • 覆盖

        当同步数据与目标数据库已有数据冲突时(主键/唯一键存在重复等),将覆盖原来的冲突数据。

      当数据发生冲突时,针对如下情况,建议选择“忽略”或者“覆盖”,否则建议选择“报错”:

      • 目标数据库存在数据
      • 多对一同步场景
      • 目标数据库手动更新数据

      对象同步范围

      对象同步范围支持增量DDL同步。如果同步期间源数据库不会发生表结构的变化,建议不勾选此项,否则请勾选此项。

      快照模式

      如果您选择的是全量同步模式的任务,数据复制服务支持设置快照模式。

      • 非快照式

        适用于停止业务数据写入的导出,如果全量同步中仍然有业务数据的修改,则导出数据为时间点非水平一致。稳定性和性能要优于快照式全量同步。

      • 快照式

        可以在业务运行时产生一份时间水平一致的快照数据,具有业务数据分析价值,过程中的数据变化不会体现在导出数据中。

        说明:

        全量阶段使用快照模式导出能够有效提升全量+增量场景下的数据同步效率,但PostgreSQL的快照机制会使导出期间数据库的历史数据不能被回收,可能有空间膨胀的现象。建议在全量或增量数据量大且源库磁盘空间充足的情况下使用该方式。

      同步对象

      同步对象选择的粒度可以为库级或表级,您可以根据业务需求,选择同步整个数据库或者只同步部分表,单个任务只能选择实例中的一个数据库中的对象进行同步,支持库名映射。

      • 库级同步:将源数据库中的所有对象全部同步至目标数据库。
      • 表级同步:将自定义选择的表对象同步至目标数据库。
        说明:

        若选择表级同步时,由于选择的表可能与数据库的其他对象存在依赖关系,若所依赖的对象没有被同时选择且未存在于目标库中,则会导致任务失败。建议您在同步之前进行确认,或选择库级同步。

      同步用户

      数据库的同步过程中,同步用户需要进行单独处理。

      同步用户一般分为两类:可同步的用户和不支持同步的用户。对于不支持同步的用户,在备注列的查看详情中会提示具体的原因,您可以根据业务需求选择是否同步用户和权限。

    6. “预检查”页面,进行同步任务预校验,校验是否可进行实时同步。
      • 查看检查结果,如有不通过的检查项,需要修复不通过项后,单击“重新校验”按钮重新进行任务预校验。

        预检查不通过项处理建议请参见《数据复制服务用户指南》中的“预检查不通过项修复方法”。

      • 预检查完成后,且所有检查项结果均通过时,单击“下一步”
        图8 预检查

        所有检查项结果均通过时,若存在请确认项,需要阅读并确认详情后才可以继续执行下一步操作。

    7. “任务确认”页面,选择同步任务的启动时间,勾选协议,单击“启动任务”,提交同步任务。
      • 同步任务的启动时间可以根据业务需求,设置为“立即启动”或“稍后启动”。
      • 预计同步任务启动后,会对源数据库和目标数据库的性能产生影响,建议选择业务低峰期,合理设置同步任务的启动时间。
    8. 同步任务提交后,开始启动同步任务,您可以返回“实时同步管理”页面,查看同步任务状态。

  2. 任务管理

    同步任务启动后,会经历全量同步和增量同步两个阶段,对于不同阶段的同步任务,您可以进行任务管理。
    • 全量同步

      查看同步进度:全量同步中的任务,您可单击任务名称,在“同步进度”页签下,查看全量同步进度,您可以查看结构、数据、索引同步的进度,也查看具体同步对象的同步进度。当全量同步进度显示为100%,表示全量同步已经完成。

    • 增量同步
      • 查看时延监控:全量同步完成后,开始进行增量同步。对于增量同步中的任务,您可单击任务名称,在“同步进度”页签下,查看增量同步同步时延,当时延为0s时,说明源数据库和目标数据库的数据是实时同步的。您也可以使用“同步对比”页签进行一致性对比。
        图9 查看时延监控
      • 查看同步对比:为了尽可能减少业务的影响和业务中断时间,增量同步中的任务,您可单击任务名称,在“同步对比”页签下创建对比任务。

        具体的同步对比操作及注意事项请参考《数据复制服务用户指南》中“对比同步项”章节。

  3. 割接建议

    建议您选择一个业务低峰期,开始正式系统割接流程。割接前,请您确认至少在业务低峰期有过一次完整的数据对比。可以结合数据对比的“稍后启动”功能,选择业务低峰期进行数据对比,以便得到更为具有参考性的对比结果。由于同步具有轻微的时差,在数据持续操作过程中进行对比任务,可能会出现少量数据不一致对比结果,从而失去参考意义。

    1. 先中断业务(如果业务负载非常轻,也可以尝试不中断业务)。
    2. 在源数据库端执行如下语句,并观察在1-5分钟内若无任何新会话执行SQL ,则可认为业务已经完全停止。
      select * from pg_stat_activity;

      上述语句查询到的进程列表中,包括DRS同步实例的连接,您需要确认除DRS同步实例的连接外无任何新会话执行SQL,即可认为业务已经完全停止。

    3. 通过DRS同步任务监控页面进行观察同步时延,保持实时同步时延为0,并稳定保持一段时间;同时,您可以使用数据级对比功能,进行割接前的最后一次数据级对比,耗时可参考之前的对比记录。
      • 如果时间允许,则选择全部对比。
      • 如果时间不允许,则推荐对比活跃表,关键业务表,第二步对比多次存在差异的表等。
    4. 确定系统割接时机,业务系统指向本云数据库,业务对外恢复使用,同步完成。

  4. 同步结束

    1. 结束同步任务:业务系统和数据库切换至本云后,为了防止源数据库的操作继续同步到目标数据库,造成数据覆盖问题,此时您可选择结束同步任务,该操作仅删除了同步实例,同步任务仍显示在任务列表中,您可以进行查看或删除。结束同步任务后,DRS将不再计费。
    2. 删除同步任务:对于已结束的同步任务,您可选择删除任务。该操作将一并删除同步任务,删除同步任务后,该任务将不会出现在任务列表中。

分享:

    相关文档

    相关产品

关闭导读