文档首页/ 数据复制服务 DRS/ 实时同步/ 入云/ 将Oracle同步到GaussDB分布式版
更新时间:2025-11-13 GMT+08:00
分享

将Oracle同步到GaussDB分布式版

支持的源和目标数据库

表1 支持的数据库

源数据库

目标数据库

  • 本地自建数据库(Oracle 10g、11g、12c、18c、19c、21c版本)
  • ECS自建数据库(Oracle 10g、11g、12c、18c、19c、21c版本)

GaussDB分布式版(支持ORA兼容模式。版本数据库内核版本为505.2及以下版本,内核版本与数据库引擎版本的关系请参考云数据库GaussDB的数据库引擎版本说明。)

数据库账号权限要求

在使用DRS进行同步时,连接源库和目标库的数据库账号需要满足以下权限要求,才能启动实时同步任务。不同类型的同步任务,需要的账号权限也不同,详细可参考表2进行赋权。DRS会在“预检查”阶段对数据库账号权限进行自动检查,并给出处理建议。

表2 数据库账号权限

类型名称

全量同步

全量+增量同步增量同步

源数据库连接账号

  • 12c及以上版本租户模式下PDB数据库同步时:
    • 使用PDB用户迁移PDB数据库时,需要具有PDB内的CREATE SESSION,SELECT ANY DICTIONARY,SELECT ANY TRANSACTION权限,以及针对单表的SELECT权限。

      授权语句:GRANT SELECT ON <userName.tbName> to drsUser;)

    • 通过CDB用户同步PDB数据库时,除了需要具有PDB内的CREATE SESSION,SELECT ANY DICTIONARY,SELECT ANY TRANSACTION权限,以及针对单表的SELECT权限,还需要具有CDB的CREATE SESSION,SELECT ANY DICTIONARY,SELECT ANY TRANSACTION,SET CONTAINER权限。
    • 授权语句:GRANT SET CONTAINER TO <userName> CONTAINER=ALL;)
  • 其他情况:

    需要具有CREATE SESSION,SELECT ANY DICTIONARY权限。针对单表的SELECT权限。

    授权语句:GRANT SELECT ON <userName.tbName> to drsUser;

  • 12c及以上版本租户模式:
    • 12c及以上版本CDB数据库同步时,需要具有CREATE SESSION,SELECT ANY DICTIONARY,EXECUTE_CATALOG_ROLE,SELECT ANY TRANSACTION,LOGMINING权限,以及针对单表的SELECT权限(GRANT SELECT ON <userName.tbName> to drsUser;)。
    • 12c及以上版本PDB数据库同步时,除了需要具有PDB内的CREATE SESSION,SELECT ANY DICTIONARY,EXECUTE_CATALOG_ROLE,SELECT ANY TRANSACTION权限,以及针对单表的SELECT权限(GRANT SELECT ON <userName.tbName> to drsUser;),还需要具有CDB的CREATE SESSION,SELECT ANY DICTIONARY,EXECUTE_CATALOG_ROLE,SELECT ANY TRANSACTION,LOGMINING,SET CONTAINER(GRANT SET CONTAINER TO <userName> CONTAINER=ALL;)权限。
  • 12c及以上版本非租户模式:

    需要具有CREATE SESSION,SELECT ANY DICTIONARY,EXECUTE_CATALOG_ROLE,SELECT ANY TRANSACTION,LOGMINING权限,以及针对单表的SELECT权限(GRANT SELECT ON <userName.tbName> to drsUser;)。

  • 11g及以下版本数据库同步时,需要具有CREATE SESSION,SELECT ANY DICTIONARY,EXECUTE_CATALOG_ROLE,SELECT ANY TRANSACTION权限,以及针对单表的SELECT权限(GRANT SELECT ON <userName.tbName> to drsUser;)。

目标数据库连接账号

  • 库级权限:需要使用root或其他有Sysadmin角色的DATABASE用户登录postgres基库,赋予用户DATABASE的CREATE、CONNECT权限。

    授权语句:GRANT CREATE, CONNECT ON DATABASE <database> TO <user>;

  • SCHEMA级权限:需要使用 root、或其他有Sysadmin角色的DATABASE用户、或使用数据库的OWNER用户登录数据库,赋予用户SCHEMA的CREATE、USAGE权限。

    授权语句:GRANT CREATE, USAGE ON SCHEMA <schema> TO <user>;

  • 表级权限:需要使用 root、或其他有Sysadmin角色的DATABASE用户、或使用数据库的OWNER用户登录数据库 ,赋予用户SCHEMA下表的DML相关权限(SELECT权限在处理无主键表时需要)。

    授予SCHEMA下所有表的DML权限:GRANT SELECT, UPDATE, INSERT, DELETE, INDEX, ALTER ON ALL TABLES IN SCHEMA <schema> TO <user>;

    授予SCHEMA下指定表的DML权限:GRANT SELECT, UPDATE, INSERT, DELETE, INDEX, ALTER ON TABLE <schema.table> TO <user>;

  • 目标库使用gsloader等工具创建相关系统表(如 public.pgxc_copy_error_log,public.gs_copy_summary)时,DRS访问相关系统表需要有系统表的all privilege权限,详细信息可参考《GaussDB工具参考》
  • 建议创建单独用于DRS任务连接的数据库账号,避免因为数据库账号密码修改,导致的任务连接失败。
  • 连接源和目标数据库的账号密码修改后,请参考修改连接信息章节修改DRS任务的连接信息,避免任务连接失败后自动重试,导致数据库账号被锁定影响使用。

支持的同步对象范围

在使用DRS进行同步时,不同类型的同步任务,支持的同步对象范围不同,详细情况可参考表3DRS会根据用户选择,在“预检查”阶段对同步对象进行自动检查

表3 支持的同步对象

类型名称

使用须知

同步对象范围

  • 全量同步时支持表、普通索引、主键与唯一约束、数据的同步。增量同步时支持表的实时同步。
  • 全量阶段不支持bfile、sdo_geometry、urowid和自定义类型。增量阶段不支持bfile、sdo_geometry、urowid、interval year to month、interval day to second和自定义类型。
  • interval day to second类型支持的最大精度是6。
  • 源端timestamp类型精度超过6时,因为GaussDB分布式版当前时间类型最高精度为6,在目的端将会降低到6位精度。
  • 全量同步结构不支持位图索引、倒排索引、函数索引。
  • 增量同步LOB类型仅支持BasicFiles属性,不支持SecureFiles属性,全量和增量支持的LOB类型大小限10M以内。
  • 对于TIMESTAMP WITH TIME ZONE类型,根据目标库时区做转换后不得大于“9999-12-31 23:59:59.999999”。
  • 不支持默认值含有表达式的函数的表的同步。
  • 不支持同步源库中的临时表。
  • 不支持同步源库中的外部表。
  • 不支持同步源库中有虚拟列的表。
  • 不支持同步既是无主键表,又是分区表的自建表,可能会导致任务失败。
  • 不支持GaussDB的无主键复制表,如果需要同步的表在GaussDB为无主键复制表,会导致任务失败。

注意事项

为保证任务的正常运行,DRS提供了自动化的检查方法,在您启动DRS任务前,会针对源数据库和目标数据库的相关配置、条件进行检查。主要的检查项和对应的处理建议请参考预检查项。除了预检查项目之外,您还需要注意的事情参见表4

表4 注意事项

类型名称

使用和操作限制

源数据库限制

  • 源数据库不允许存在索引列的长度之和超过目标库索引列长度限制的索引,具体长度要求请参见索引长度说明

使用限制

通用:

  • 不允许修改、删除连接源和目标数据库的用户的用户名、密码、权限,或修改源和目标数据库的端口号。
  • 禁止对Oracle源库做resetlogs操作,否则会导致数据无法同步且任务无法恢复。
  • 不支持LOB类型的rollback操作,否则会导致同步任务失败。
  • 不支持修改源数据库Oracle用户名(SCHEMA名),包括11.2.0.2之前版本通过修改USER$字典表方式及11.2.0.2之后通过ALTER USER username RENAME TO new_username修改SCHEMA名称的场景。

全量同步阶段:

  • 对于全量同步中的目标数据库表对象,不能进行写入操作,否则会导致数据不一致。
  • 全量同步分为表结构同步(含索引)、数据同步两个阶段,任务中只要有一个表的结构在目标库中创建成功即进入数据同步阶段。如果同步完成产生失败表,再启动时将只同步数据,不同步表结构信息,用户必须手动在目标库中建表。
  • 全量同步表结构时,如果目标库存在与源库同名约束会导致建表失败。
  • 全量同步表结构时,列名不能是CTID、XMIN、CMIN、XMAX、CMAX、TABLEOID、XC_NODE_ID、TID、OID、GS_TUPLE_UID、TABLEBUCKETID这些GaussDB禁止的字段,否则会导致建表失败。
  • DRS全量同步表结构时,源库中的char、varchar2类型长度在目标库会按照字节长自动扩大(因为目标库为字节长),至少扩大1.5倍。扩大倍数和源库目标库的字符集有关,例如同为UTF8的情况下,默认扩大3倍,同为GBK的情况下,默认扩大2倍。
  • DRS全量同步表结构时,目标库存在与某用户名称同名的schema,用其他用户进行同步表结构到schema时,需要使用grant [role] to [role]的方式为此用户赋权,否则可能因为无法创建表结构而导致同步失败。
  • 全量同步分区表的结构时会将该对象转为非分区的普通表,增量同步时,源库跟分区表相关的操作,可能无法同步到目标库或者在目标库执行失败。
  • 全量同步表结构时只支持字符串或数字类型的普通默认值约束,不支持函数、序列等类型的默认值约束。

增量同步阶段:

  • 增量同步过程中,支持部分DDL操作。异构数据库DDL转换需要分析语义,考虑语法兼容性,无法做到完美转换,所以目前仅支持部分DDL操作,仅在转换成功并在以下范围内时会进行同步。如果出现其余情况的DDL同步导致的任务异常,需要手动在目标库执行相应的DDL来规避。
    说明:

    异构DDL同步存在兼容性差异风险,由于GaussDB的使用约束,可能因差异引起数据不一致,请充分了解GaussDB DDL语法说明,验证DDL兼容性,详见GaussDB相应版本的用户指南。

    • 表级同步支持alter table add column、alter table drop column、alter table rename column、alter table modify column以及truncate table的基本DDL,不支持默认值等的修改。
    • 增量DDL新增的字段不会自动扩展字符长度。
    • 增量同步时,不支持重命名表、在线重定义表、交换分区。
  • 增量同步阶段,修改抓取任务的启动位点主要用于重新同步数据。
    • 修改抓取位点之后,上一次对象级对比结果不会展示出来。
    • 单独修改抓取任务的启动位点,会把该位点同步到回放任务的启动位点上,即回放任务的启动位点和抓取任务的启动位点一致,不影响用户单独修改回放任务的启动位点。
  • 增量同步时,BLOB末尾的0x00、CLOB末尾的空格会被截断。
  • 增量同步时,不建议选择混合分区表,因为混合分区表中的外部分区数据变更不产生DML日志,DRS增量数据同步无法获取变更信息,会存在数据不一致的风险。
  • 增量同步时,增量解析时间类型仅支持在Oracle时间类型合法范围内的数据,超范围的数据可能导致任务异常,例如年份大于9999时会出现数据截断。
  • 增量同步时,不支持表中同时具有Number类型主键极值(小于-9.9999999999999999999999999999999999或大于9.99999999999999999999999999999999999E+125)和LOB类型的场景。
  • 增量同步LOB类型仅支持BasicFiles属性,不支持SecureFiles属性,支持的LOB类型大小限10M以内。
  • 增量同步时,源端或者目标端数据库异常会触发任务失败,数据库恢复后重试启动任务时触发全局启动,此时会忽略原有抓取或回放组件的状态,同时回放也会按照抓取的中断点位再启动。
  • 增量阶段不支持Oracle字符集扩展的字符,标准字符集无法解析Oracle自定义扩展字符。
  • 增量DDL同步不支持alter table add column ... visible(使用数据库图形工具界面加列会出现这种DDL,请手动执行加列DDL,不使用visible关键字)。

常见故障排查:

  • 在任务创建、启动、全量同步、增量同步、结束等过程中,如有遇到问题,可先参考“故障排查”章节进行排查。

其他限制

  • 同步表结构时支持以下函数作为默认值:decode、nvl、nvl2、instr、substr、to_char、to_date、to_timestamp、length、lengthb、sysdate、trunc、nullif、next_day、regexp_instr、add_months、systimestamp、to_number、empty_clob、empty_blob。将这些函数作为default值时,需要目标库也有相同功能的函数。对于目标库不存在对应函数的情况,可能会出现以下结果:
    • 默认值函数可能会被置空。
    • 创建表失败,导致对象对比不一致或者任务失败。
  • 如果表中只有LOB字段,可能出现数据不一致性或任务失败的情况。
  • 如果Oracle中使用LOB类型各自的empty函数写入数据时,通过JDBC查询出来的值是空字符串,写入到目标库后是空字符串还是NULL取决于目标库对空字符串值的处理。
  • Oracle->GaussDB同步任务默认允许回环拓扑,不允许级联拓扑(即不支持从实例A同步到实例B,再从实例B同步到实例C)。
  • 针对无主键且无索引的表,非大字段的列必须大于三列,否则会因为无法全列匹配导致增量异常。
  • 增量同步不支持Oracle上的分布式事务(XA事务)和PARALLEL DML。
  • 选择手动创建表结构时,目标库中的时间类型是否带有时区需要与源库中保持一致,否则可能会因为时区转换导致时间数据不一致。
  • 确保目标库已创建以小写字母命名的数据库。
  • 支持目标数据库中的表比源数据库多列场景,但是需要避免以下场景可能导致的任务失败。
    • 目标端多的列要求非空且没有默认值,源端insert数据,同步到目标端后多的列为null,不符合目标端要求。
    • 目标端多的列设置固定默认值,且有唯一约束。源端insert多条数据后,同步到目标端后多的列为固定默认值,不符合目标端要求。
  • 暂不支持级联单向同步,例如从实例A同步到实例B,再从实例B同步到实例C。
  • 不建议在数据库中使用非精确数值类型做主键,该特性影响DRS增量场景下对UPDATE、DELETE语句的同步,同时也会导致内容比对不可用。主键支持的类型可参考Oracle数据库->GaussDB数据库映射关系
  • Oracle归档日志文件大小必须大于单条数据最大值,避免单条数据日志跨文件(超过2个日志文件)导致的增量数据解析异常。
  • 当Oracle字符集是WE8MSWIN1252、WE8ISO8859P1时,CLOB列同步到目标库可能出现乱码,建议先修改源库字符集为AL32UTF8再同步数据。
  • 当使用PDB数据库同步时,由于Oracle LogMiner组件的限制,增量同步时必须打开全部PDB。
  • Oracle 12.2及以上版本,由于Oracle LogMiner组件的限制,增量同步不支持表名或列名超过30个字符。
  • 当每行的行内存储类型数据的总长度超过GaussDB的限制时(默认是8192字节),可能会导致任务失败。
  • 对于Oracle RAC集群,建议使用SCAN IP+ SERVICE_NAMES方式创建任务,SCAN IP具有更强的容错性,更好的负载能力,更快的同步体验。
  • 源库为Oracle RAC时,如果需要使用SCAN IP配置DRS任务,需要保证SCAN IP、DRS节点的IP同时能与源库的所有VIP互通(Oracle内部机制),否则无法通过连通性检查。如果不使用SCAN IP,可以使用某一节点的VIP,这种情况下DRS日志解析只会在VIP指定的RAC节点上进行。
  • 如果源库为RAC,增量同步首次启动时所有RAC节点必须正常在线,否则增量启动会出现异常。
  • 如果源库为RAC,增量同步时,不支持增加、减少节点数量,避免导致增量同步异常(为保证数据的强一致性)。
  • 无主键表缺乏行的唯一性标志,网络不稳定时涉及重试,表数据存在少量不一致的可能性。
  • 如果源库和目标库字符集不一致,如源库是ZHS16GBK,目标库是UTF8,由于ZHS16GBK字符集单个中文字符占用2个字节,而UTF8字符集单个中文字符占用3个字节,可能会导致CHAR或VARCHAR类型数据同步到目标库后超出字段定义长度,所以客户需要根据实际情况对目标库CHAR和VARCHAR类型字段长度进行扩充(如扩大为源库的1.5倍)。
  • 使用DRS同步表结构的场景下,同一个schema中,同步的表中,表、约束、索引等不能有忽略大小写后的同名对象,比如表"A"中有索引名"inx1", 表B中有索引名"a",表A和索引"a"忽略大小写重名了,会导致结构同步失败。多个schema映射到一个schema的场景,源库的多个schema中也不能包含同名但字母大小写不同的表、约束和索引。
  • 全量+增量或单增量任务场景,选择Logminer增量读取方式时不支持直接连PDB数据库,用户需要提供CDB的Service Name/SID、用户名和密码。
  • 全量和增量同步不支持隐藏列(UNUSED, INVISIBLE)。
  • 当目标库为GaussDB分布式版时,增量同步阶段源库Oracle对分布列的update操作会导致在GaussDB数据库执行失败,造成数据不一致,所以业务上要尽量规避对分布列的更新。
  • 建议目标库禁用全局二级索引(GSI),否则可能会导致增量同步失败。
  • lob类型及扩展字符类型(字节长度超过4000)不建议作为增量数据过滤条件,Oracle日志中可能出现不记录update旧值的情况。
  • 任务再编辑增加新表时,请确保新增的表的事务都已提交,否则未提交的事务可能无法同步到目标库。建议在业务低峰期做增加表的操作。
  • 结束任务时,如果目标库同步表中已关联序列,DRS将自动重置目标库序列值。重置的自增序列值为源库序列值+安全余度,自减序列值为源库序列值-安全余度,安全余度默认为10000。
  • 当双AZ任务发生切换(例如主任务AZ级故障)时,如果主任务延迟较大,或源数据库有长事务未提交,任务倒换后可能因源数据库日志被清理导致任务无法启动,或者因为延迟、长事务期间的DDL变更导致同步异常。
  • 在源数据库Oracle附加日志级别不为all的场景下,如果源数据库增量update操作的数据在目标库不存在,即使冲突策略选的是覆盖,也无法将源数据库完整数据写入目标库。如果要将数据写入目标库,需要源数据库附加日志级别设置为all。
  • Oracle更新唯一约束列且命中多行时可能出现互相冲突,极端场景下可能造成数据不一致。
  • XMLTYPE类型在Oracle内部存储方式为CLOB或BLOB,使用限制同CLOB和BLOB一致。
  • 仅Oracle 11g及以上版本支持XMLTYPE类型同步。
  • 源库中的空字符串写入目标库的结果是空字符串或者null取决于目标库的兼容性处理,例如GaussDB A兼容模式会将空字符串自动转换为null。

操作步骤

  1. 在“实时同步管理”页面,单击“创建同步任务”。
  2. 在“同步实例”页面,填选区域、项目、任务名称、描述、同步实例信息,单击“开始创建”

    • 任务信息
      图1 同步任务信息
      表5 任务和描述

      参数

      描述

      区域

      当前所在区域,可进行切换。

      项目

      当前区域对应的项目,可进行切换。

      任务名称

      任务名称在4到50位之间,必须以字母开头,可以包含字母、数字、中划线或下划线,不能包含其他的特殊字符。

      描述

      描述不能超过256位,且不能包含! = < > & ' " \ 特殊字符。

    • 同步实例信息
      图2 同步实例信息
      表6 同步实例信息

      参数

      描述

      数据流动方向

      选择“入云”

      源数据库引擎

      选择“Oracle”。

      目标数据库引擎

      选择“GaussDB分布式版”。

      网络类型

      此处以“公网网络”为示例。目前支持可选“公网网络”“VPC网络”“VPN、专线网络”

      • VPC网络:适合云上同账号同Region同VPC场景下数据库之间的同步。
      • 公网网络:适合通过公网网络将其他云下或其他平台的数据库同步到目标数据库的场景,此类型要求数据库绑定弹性公网IP(EIP)。当一端为本云的数据库实例时,DRS任务与该端的通信方式为VPC内网。
      • VPN、专线网络:适合VPN、专线、CC、VPCEP、或者用户已打通VPC对等连接的网络场景,实现其他云下自建数据库与云上数据库同步、云上同Region跨账号、或云上跨Region的数据库之间的同步。

      DRS任务类型

      选择DRS任务类型,可选“单AZ”和“双AZ”。

      • 双AZ:一主一备的经典高可用架构,提高了DRS任务的可靠性。双AZ任务创建后,DRS会同时创建一主一备两个子任务,当主AZ任务发生异常,DRS会自动启动备AZ任务继续进行同步,提高同步任务的可靠性。适用于业务数据量较大,需要长期同步,并对中断时间有严格要求的场景。
      • 单AZ:采用单个节点部署架构,每个任务只创建一个节点,性价比较高。适用于业务数据量较小,短期同步,并对中断时间无严格要求的场景。

      目前仅部分链路支持DRS任务类型的选择,详细说明可参考双AZ任务倒换

      目标数据库实例

      用户所创建的GaussDB分布式版实例。

      同步实例所在子网

      请选择同步实例所在的子网。也可以单击“查看子网”,跳转至“网络控制台”查看实例所在子网帮助选择。

      默认值为当前所选数据库实例所在子网,请选择有可用IP地址的子网。为确保同步实例创建成功,仅显示已经开启DHCP的子网。

      同步模式

      DRS任务支持的同步模式,此处以“全量+增量”为示例。DRS全量、增量底层实现原理可参考产品架构和功能原理

      指定公网IP

      网络类型选择“公网网络”时可见,选择为DRS实例绑定的弹性公网IP。任务创建时,DRS将会自动绑定该弹性公网IP,等待任务结束后将自动解绑该弹性公网IP。

      DRS任务类型选择“双AZ”时,需要分别指定主IP和备IP。

      公网网络迁移产生的数据传输费用收取标准请参见:弹性公网IP价格计算器

    • 任务类型
      图3 任务类型
      表7 任务类型信息

      参数

      描述

      规格类型

      选择DRS实例的规格类型,不同规格类型对应不同性能的性能上限,详细可参考实时同步链路规格说明

      说明:

      目前,DRS同步仅支持任务类型为单AZ的同步任务升级实例规格,不支持降低规格,具体操作及约束限制可参考同步规格变更

      可用区

      DRS任务创建的可用区,选择跟源或目标库相同的可用区性能更优。

      DRS任务类型选择“双AZ”时,可用区分为“主可用区”和“备可用区”。

      图4 可用区
    • 企业项目和标签
      图5 企业项目和标签

      表8 企业项目和标签

      参数

      描述

      企业项目

      企业项目是一种云资源管理方式,企业项目管理服务提供统一的云资源按项目管理,以及项目内的资源管理、成员管理。请在下拉框中选择所在的企业项目,其中,default为默认项目。

      更多关于企业项目的信息,请参见《企业管理用户指南》

      如果需要自定义企业项目,请在控制台右上角单击“企业”,进入“企业项目管理”页面创建,具体请参见《企业管理用户指南》中“创建企业项目”的内容。

      标签

      • 可选配置,对同步任务的标识。使用标签可方便管理您的任务。每个任务最多支持20个标签配额。
      • 如果您的组织已经设定DRS的相关标签策略,则需按照标签策略规则为任务添加标签。标签如果不符合标签策略的规则,则可能会导致任务创建失败,请联系组织管理员了解标签策略详情。
      • 任务创建成功后,您可以单击任务名称,在“标签”页签下查看对应标签。关于标签的详细操作,请参见标签管理

    对于创建失败的任务,DRS默认保留3天,超过3天将会自动结束任务。

  3. 在“源库及目标库”页面,填选源库信息和目标库信息,单击“源库和目标库”处的“测试连接”,分别测试并确定与源库和目标库连通后,单击“下一步”

    图6 源库信息
    表9 源库信息

    参数

    描述

    IP地址或域名

    源数据库的IP地址或域名。

    说明:

    对于RAC集群,建议使用SCAN IP接入,提高访问性能。

    端口

    源数据库服务端口,可输入范围为1~65535间的整数。

    数据库服务名

    数据库服务名(Service Name/SID),客户端可以通过其连接到Oracle,具体查询方法请参照界面提示。

    PDB名称

    PDB同步仅在Oracle12c及以后的版本支持,该功能为选填项,当需要迁移PDB中的表时开启。

    PDB功能开启后,只能迁移该PDB中的表,并且需要提供CDB的service name/sid及用户名和密码,不需要PDB的用户名和密码。

    数据库用户名

    源数据库的用户名。

    数据库密码

    源数据库的用户名所对应的密码。

    SSL安全连接

    通过该功能,用户可以选择是否开启对迁移链路的加密。如果开启该功能,需要用户上传SSL CA根证书。

    说明:
    • 最大支持上传500KB的证书文件。
    • 如果不启用SSL安全连接,请自行承担数据安全风险。
    图7 目标库信息
    表10 目标库信息

    参数

    描述

    数据库实例名称

    默认为创建同步任务时选择的GaussDB分布式版实例,不可进行修改。

    数据库用户名

    目标数据库的用户名。

    数据库密码

    目标数据库的用户名所对应的密码。数据库用户名和密码将被系统加密暂存,直至该任务删除后清除。

  4. “设置同步”页面,选择同步对象,此处必须手动输入目标数据库名称,完成后单击“下一步”

    图8 设置同步
    表11 同步对象

    参数

    描述

    流速模式

    流速模式支持限速和不限速,默认为不限速。限速模式只对全量阶段生效,增量阶段不生效。

    • 限速

      自定义的最大同步速度,具体速度受网络等多种因素的影响,同步过程中每个任务(多任务时为每个子任务)的同步速度将不会超过该速度。

      当流速模式选择了“限速”时,您需要通过流速设置来定时控制同步速度。流速设置通常包括限速时间段和流速大小的设置。默认的限速时间段为“全天限流”,您也可以根据业务需求选择“时段限流”。自定义的时段限流支持最多设置10个定时任务,每个定时任务之间不能存在交叉的时间段,未设定在限速时间段的时间默认为不限速。

      流速的大小需要根据业务场景来设置,不能超过9999MB/s。

      图9 设置流速模式
    • 不限速
      对同步速度不进行限制,通常会最大化使用源数据库的出口带宽。该流速模式同时会对源数据库造成读消耗,消耗取决于源数据库的出口带宽。比如源数据库的出口带宽为100MB/s,假设高速模式使用了80%带宽,则同步对源数据库将造成80MB/s的读操作IO消耗。
      说明:
      • 限速模式只对全量阶段生效,增量阶段不生效。
      • 您也可以在创建任务后修改流速模式。具体方法请参见修改流速模式

    分片方式

    可选“按主键分片”“按ROWID分片”,根据实际需求进行选择。

    • “按主键分片”

      有主键表利用主键值分片,分片效率低于按ROWID分片方式。

    • “按ROWID分片”

      针对无主键大表分片更友好,分片效率更高。

      选择“按ROWID分片”的使用限制:全量期间限制源端导致ROWID变化的操作,例如导入数据(import或impdp等)、 MOVE (ALTER TABLE <TABLE_NAME> MOVE)、SHRINK (ALTER TABLE <TABLE_NAME> SHRINK SPACE)、闪回(FLASHBACK TABLE <TABLE_NAME>)、分区表分区定义DDL变更(拆分、合并、交换、重定义等)、分区表行记录分区值更新 等,以上操作可能导致同步数据不一致。对于 SHRINK SPACE、分区值变更、闪回等场景可采用如下方法约束:ALTER TABLE XXXX DISABLE ROW MOVEMENT; 对于导入数据(import或impdp等)、ALTER TABLE <TABLE_NAME> MOVE、分区表分区定义DDL变更(拆分、合并、交换、重定义等)需要用户审视应用和运维流程自主规避。

    对象同步范围

    对象同步范围支持选择增量DDL同步。您可以根据业务需求选择是否进行同步。

    DML同步

    选择需要同步的DML操作,默认都勾选。

    不勾选Delete则不会同步源库增量数据中的Delete语句,可能会导致数据不一致,因此存在数据冲突或任务失败的风险。

    增量读取方式

    选择增量阶段读取日志方式。

    • LogMiner:采用Oracle官方接口读取重做日志文件,稳定性好。
    • Binary Reader:Binary Reader 采用DRS自研方式直接读取和解析原始重做日志文件,性能高,对Oracle资源消耗低。

    目前建议使用LogMiner。

    两种方式的对比详见表格表12

    增量支持DDL

    对象同步范围勾选“增量DDL”时可见,选择增量同步的DDL类型,用户根据需求可选择“默认值”“自定义”

    • “默认值”

      表级同步情况下,已选定的同步表DDL将会同步至目标,不支持的DDL将不同步。目前支持的DDL有CREATE_TABLE,ALTER_TABLE,TRUNCATE_TABLE。

    • “自定义”:用户根据需求,选择需要同步的DDL类型,不同链路支持的DDL类型以界面显示为准。

    同步对象

    左侧框是源数据库对象,右侧框是已经选择的对象,可选表级同步或导入对象文件,您可以根据业务场景选择对应的数据进行同步。

    • 在同步对象右侧已选对象框中,可以使用对象名映射功能进行源数据库和目标数据库中的同步对象映射,具体操作可参考对象名修改(对象名映射)
    说明:
    • 选择对象的时候支持对展开的库进行搜索,以便您快速选择需要的数据库对象。
    • 如果有切换源数据库的操作或源库同步对象变化的情况,请在选择同步对象前单击右上角的,以确保待选择的对象为最新源数据库对象。
    • 当对象名称包含空格时,名称前后的空格不显示,中间如有多个空格只显示一个空格。
    • 选择的同步对象名称中不能包含空格。
    表12 LogMiner与Binary Reader对比表

    对比内容

    LogMiner

    Binary Reader(裸日志)

    DG备库

    日志解析落后一个日志文件(可能产生较大延时),不支持LOB、XML类型

    支持实时同步,支持LOB、XML类型同步。源库redo、归档日志文件位于数据库本地磁盘时,需要用户在主库手工创建

    DIRECTORY 对象(DRS可在高级设置页签配置主库信息以自动创建目录对象)

    ASM

    1.创建ASM账号(需要与DRS 任务使用的Oracle账号同名)并赋予 sysasm 角色

    2. RAC环境需配置需为scan配置ASM

    版本

    10g,11g,12c,18c,19c

    11g,12c,18c,19c

    性能

    权限(仅限方案差异)

    LOGMINING

    CREATE ANY DIRECTORY

    Cluster表

    支持

    不支持

    LOB

    1. 性能低

    2. 租户模式需要开启全部PDB

    1. 性能高

    2. 租户模式需要开启同步的PDB

    IOT

    受限支持(行溢出即OVERFLOW区更新不支持,IOT分区表不支持)

    支持

    SSL

    支持

    不支持

    对象名称

    12.2及以上版本, 不支持表名或列名超过30个字符

    XA事务(父子事务)

    不支持, 有告警(需要登录运维管理平台查看告警信息)

    支持

    对源库影响

    1. 影响源库 IO、网络与CPU,每个读线程占用源库80%单核 CPU;支持在读取时过滤日志,减少网络带宽占用

    2. 对PGA和内存占用较高

    1. 只影响源库磁盘 IO 与网络,同性能对源库CPU 占用为LogMiner 4%;无法在读取时过滤日志

    2. 不占用PGA, 内存占用低

    ROWID 解析

    LOB场景存在小概率不支持的情况,可能需要反查,无主键LOB表存在不支持的情况

    支持

    租户模式(PDB)

    支持,需要通过CDB转PDB,不支持直接连接PDB

    1. 测试连接等处需要同时填写CDB和PDB连接信息, 并且只能使用在CDB和指定PDB下同时赋予权限的COMMONUSER(通常该类用户的默认前缀为C##)

    2. 需要开启全部PDB

    支持,可以直接接入PDB

    1. 测试连接处可以使用PDB用户, 连接服务名可以只填PDB

    2. 只需要开启同步的PDB

  5. “高级设置”页,可对之前步骤2选择“全量”同步或“增量”同步的运行参数进行设置,设置完成后单击“下一步”

    图10 全量同步
    表13 全量同步参数说明

    参数名

    功能描述

    默认值

    全量同步对象类型

    全量同步对象类型(包含主键和唯一键),可选同步表结构、同步数据、同步普通索引,根据实际需求进行选择要同步内容。其中同步数据为必选项。

    同步数据。

    流模式

    用于控制数据的同步方式。 流模式下,每个数据分片由一个导出线程和一个导入线程进行同步,而且整个分片同步完成后一次性提交;即一个分片的数据同步的sql语句都在一个事务内。非流模式下,每个数据分片由一个导出线程和多个导入线程进行同步,导入按数据缓存大小进行提交,默认DRS的缓存大小为2M。即一个分片的数据同步的sql语句可能是多个事务。对于无法分片的表(如主键分片策略下的无主键大表)推荐关闭流模式,其他场景推荐使用流模式。

    选中。

    配置并发数

    开启后可选是否配置任务的导入导出并发数。

    打开。

    导出并发数

    控制数据导出的线程数,范围在1-16,并发数越大对源库压力越大

    8

    导入并发数

    控制数据导入的线程数,流模式下导入并发数要等于导出并发数,非流模式无此限制。范围在1-16,并发数越大对目标库压力越大。

    8

    导入模式

    • COPY模式:

      基于GaussDB特殊的接口, 数据导入速率较高,但数据导入异常时会直接停止。

    • INSERT模式:

      采取直接拼接逻辑语句的方式,导入速率较低,但可自动跳过主键冲突的数据。

    copy模式。

    分片记录数

    对表进行分片导出,来提供实时同步的效率。

    • 值为0

      对所有表不分片,每张表作为一个整体进行同步。

    • 值为其他数值

      按照指定数值对表进行分片(根据主键列),当表的记录数小于该值时,不分片。

    • 如果表为分区表,则每个分区作为一个分片进行同步,不再按照记录数据分片。
    • 如果表为无主键和唯一索引表,则不分片,该参数值无意义。
    • 如果表分析不及时,即ALL_TABLES视图的NUM_ROWS值为空,也不进行分片。

    520000

    结构迁移字符集适配

    同步对象类型勾选“同步表结构”时可见。

    表结构迁移时,对于字符串类型的长度,需要处理字符数到字节数的转换,根据字符集扩展长度,以兼容中文等非ASCII字符。

    该处理可能导致目标库长度有冗余,char类型数据末尾有空格,如果业务上对长度敏感(比如不允许有空格),且确认数据不包含非ASCII字符,可以选择保持原库字符长度。

    自动适配字符集长度。

    图11 增量同步
    表14 增量同步参数说明

    参数名

    功能描述

    默认值

    日志抓取并发数

    读取Oracle日志的并发线程数,可配范围1-64。

    1

    抓取启动位点

    指定抓取启动的SCN点,这个SCN号要根据实际的需求进行设计,它由两部分组成,分别是抓取的起始SCN号,和有效数据的SCN号,具体的解释需要参考Oracle的SCN相关概念。

    空,抓取默认采用数据库的当前SCN作为启动点。

    回放任务并发数

    向目标库写入数据的并发线程数,可配范围1-64。

    64

    回放启动策略

    • 自动

      启动任务后,回放组件会自动启动。

    • 手动

      启动任务后,回放组件不启动,需要手动进行单独启动。

    自动。

    冲突策略

    • 覆盖

      当数据回放报错时,会用DRS抓取到的数据覆盖掉目标库的数据。

    • 报错

      当数据回放报错时,会直接返回错误,界面报同步异常。

    • 忽略

      当数据回放报错时,会跳过报错的记录,继续运行。

    覆盖。

    回放启动位点

    指定回放启动的SCN点。

    空,若不指定,默认和抓取启动位点相同。

  6. 在“数据加工”页面,选择需要加工的数据,进行列加工或者数据过滤。

    • 如果不需要数据加工,单击“下一步”。
    • 如果需要加工列或者数据过滤,参考数据加工中的列加工,设置相关规则。
    图12 数据加工

  7. “预检查”页面,进行同步任务预校验,校验是否可进行实时同步。

    • 查看检查结果,如有不通过的检查项,需要修复不通过项后,单击“重新校验”按钮重新进行任务预校验。

      预检查不通过项处理建议请参见《数据复制服务用户指南》中的“预检查不通过项修复方法”。

    • 预检查完成后,且所有检查项结果均通过时,单击“下一步”

      所有检查项结果均通过时,若存在请确认项,需要阅读并确认详情后才可以继续执行下一步操作。

  8. “任务确认”页面,设置同步任务的启动时间、任务异常通知设置、SMN主题、时延阈值、任务异常自动结束时间,并确认同步任务信息无误后,勾选协议,单击“启动任务”,提交同步任务。

    图13 任务启动设置

    表15 任务启动设置

    参数

    描述

    启动时间

    同步任务的启动时间可以根据业务需求,设置为“立即启动”或“稍后启动”。

    说明:

    预计同步任务启动后,会对源数据库和目标数据库的性能产生影响,建议选择业务低峰期,合理设置同步任务的启动时间。

    任务异常通知设置

    该项为可选参数,开启之后,选择对应的SMN主题。当同步任务状态、时延指标或数据异常时,系统将发送通知。

    SMN主题

    “任务异常通知设置”项开启后可见,需提前在SMN上申请主题并添加订阅。

    SMN主题申请和订阅可参考《消息通知服务用户指南》

    时延阈值

    在增量同步阶段,源数据库和目标数据库之间的同步有时会存在一个时间差,称为时延,单位为秒。

    时延阈值设置是指时延超过一定的值后(时延阈值范围为0到3600s),DRS可以发送告警通知。告警通知将在时延稳定超过设定的阈值6min后发送,避免出现由于时延波动反复发送告警通知的情况。

    说明:
    • 当时延阈值设置为0时,不会发送通知给收件人。
    • 首次进入增量同步阶段,会有较多数据等待同步,存在较大的时延,属于正常情况,不在此功能的监控范围之内。
    • 设置时延阈值之前,需要设置任务异常通知。

    数据异常通知

    该项为可选参数,开启之后,当同步任务数据异常时,系统将发送通知。

    任务异常自动结束时间(天)

    设置任务异常自动结束天数,输入值必须在14到100之间,默认值14。

    说明:
    • 仅按需计费任务支持设置任务异常自动结束时间,包年/包月任务不支持。
    • 异常状态下的任务仍然会计费,而长时间异常的任务无法续传和恢复。设置任务异常自动结束天数后,异常且超时的任务将会自动结束,以免产生不必要的费用。

  9. 同步任务提交后,您可在“实时同步管理”页面,查看并管理自己的任务

    • 您可查看任务提交后的状态,状态请参见任务状态说明
    • 在任务列表的右上角,单击刷新列表,可查看到最新的任务状态。
    • 对于未启动、状态为配置中的任务,DRS默认保留3天,超过3天DRS会自动删除后台资源,当前任务状态不变。当用户再次配置时,DRS会重新申请资源,此时DRS任务IP会发生改变。
    • 对于公网网络类型的任务,由于DRS需要在任务结束后删除后台资源,所以该任务绑定的弹性公网IP需要等待一段时间,才能恢复为解绑状态。

相关文档